Cabecera personalizada

El blog de Mikel Niño
Emprendimiento digital, startups, Big Data Analytics y nuevos modelos de negocio

¿Cuál es la relación entre “Data Science” y “Big Data”?

Más allá de las múltiples referencias que hemos hecho al Big Data, en la entrada anterior introducíamos también el término de “data science” (ciencia de datos) para explicar las competencias que engloba el perfil profesional de científico de datos. De hecho las referencias al concepto de data science se han venido multiplicando a la vez que ha crecido la popularidad del Big Data. ¿Cuál es entonces la relación entre ambos conceptos, son lo mismo o implican ideas diferentes? Como ya hemos dicho anteriormente no nos movemos en un terreno donde las definiciones estén escritas en piedra, y a veces lo que engloba o no un término tiene más que ver con el marketing que con razones puramente técnicas. No obstante, en esta entrada describiré un marco que nos permitirá encuadrar correctamente la relación entre Data Science y Big Data.

La idea de la ciencia de datos no es en absoluto reciente, y está basada en la aplicación de las disciplinas que mencionábamos al describir el perfil del científico/analista de datos y de las técnicas que también mencionábamos anteriormente al identificar herramientas que están viviendo una cierta segunda juventud gracias a la eclosión del fenómeno Big Datatales como sistemas de analítica/minería de datos y de aprendizaje automático. Estas técnicas y herramientas se llevan usando desde hace décadas con el objetivo de extraer conocimiento de los datos, con el fin de apoyar procesos de toma de decisiones en determinados negocios. Por citar algunos ejemplos, las empresas financieras o aseguradoras son quizá quienes vienen haciendo uso desde hace más tiempo de esta ciencia de datos aplicada a sus procesos de negocio, explotando sus bancos de datos como un activo estratégico de la empresa.

En la evolución de los diferentes nichos de negocio donde esta ciencia de datos se viene aplicando, nos encontramos con el auge de la web 2.0 y con empresas como Google, Yahoo, etc. que quieren explotar sus bancos de datos para sus procesos de negocio (p.ej. inserción de publicidad), pero que se ven obligados a desarrollar nuevas técnicas y herramientas tecnológicas (que se añaden a las ya empleadas dentro de la ciencia de datos digamos “tradicional”) para poder hacerlo eficientemente, ya que el gran volumen de sus activos de datos hace imposible aplicarles las técnicas tradicionales. Es entonces cuando, motivadas por dicha necesidad de negocio, surgen las primeras herramientas Big Data, como la pieza extra que era necesaria para solucionar determinados casos como los de las citadas empresas.

Debido a la gran atención mediática que recibe toda acción emprendida por empresas como Google (y más adelante Facebook o Twitter) impulsando el desarrollo de herramientas Big Data (y, dicho sea de paso, debido también a una cierta inercia por parte del resto del mundo a dejarnos llevar por el bombardeo de noticias tecnológicas que nos llegan desde Silicon Valley y a creer que los únicos modelos de negocio digital válidos son los que allí se desarrollan), se ha venido generando ese efecto “fagocitador” de la etiqueta de Big Data sobre todo lo que abarca la ciencia de datos. No obstante, de lo comentado deberíamos entender que realmente Big Data no es más que una parte de lo que abarcan los principios, técnicas y herramientas de la ciencia de datos. Si bien es cierto que el uso de Big Data es necesario para ciertos casos y que habilita nuevos modelos de negocio (mejorando así el "caldo de cultivo" para una aplicación más potente de la ciencia de datos), hay también muchas necesidades de negocio en las que el volumen o complejidad del activo de datos a explotar realmente no requiere de herramientas específicas para Big Data, pero para las que sí nos podría ser enormemente provechoso el uso de técnicas y herramientas más tradicionales.

No hay comentarios:

Publicar un comentario