Cabecera personalizada

El blog de Mikel Niño
Industria 4.0, Big Data Analytics, emprendimiento digital y nuevos modelos de negocio

Diseccionando la analítica de datos en los tiempos del “Big Data”

La puesta de moda del término Big Data y la frecuencia con la que lo venimos oyendo en muy diferentes contextos no parece que estén yendo acompañadas de una visión demasiado clara del tipo de tecnologías que integra, de su origen, de los objetivos que motivaron su creación o de sus campos de aplicación. En esta entrada trataré de explicar algunas claves por las que poder empezar a explorar todo lo que pretende abarcar esta tendencia tecnológica.

La eclosión del concepto de Big Data proviene, en primer lugar, de la evolución que ha sufrido en la última década el mundo de los sistemas de bases de datos y de las nuevas herramientas que han ido surgiendo para responder a las necesidades de procesamiento paralelo y distribuido que se generan en el entorno web, principalmente por la utilización masiva de plataformas web 2.0 y redes sociales. Las ingentes cantidades de datos que se generan de manera continua en este entorno y, sobre todo, el interés por explotarlos, han sido los principales motores para la creación de nuevas soluciones en este entorno, que comenzaron a ser promovidas en su día principalmente por los grandes buscadores web (Google, Yahoo). Así, surgieron herramientas que hoy en día aparecen ligadas a casi cualquier proyecto de Big Data: el paradigma Map-Reduce, nuevos sistemas de ficheros distribuidos, Hadoop, las bases de datos NoSQL, …

Por otro, tenemos un grupo muy diferente de herramientas, como son los sistemas de analítica/minería de datos y de Machine Learning (Aprendizaje Automático), que no son precisamente unos recién llegados al mundo de la informática y que han venido utilizándose durante décadas en muy diferentes campos, pero que es ahora en este nuevo contexto donde están viviendo una especie de “segunda juventud”, ya que encuentran un campo de aplicación en el que como hemos visto están puestas muchas miradas y de muy importantes agentes en el mundo digital.

La fusión de ambos grupos de soluciones compone un kit de herramientas de gran potencia para abordar proyectos de lo que podríamos llamar Big Data Analytics (analítica de datos con herramientas de Big Data). Este tipo de proyectos nacen lógicamente en el entorno donde más “big” es el Big Data, es decir, en la explotación de los datos provenientes de las innumerables cantidades de datos que se generan en las interacciones en los entornos web 2.0 y las redes sociales, que pueden ser almacenados y tratados con gran eficiencia gracias a esas nuevas herramientas, y a las que se quiere aplicar una suerte de “inteligencia” que permita detectar patrones, interpretar la “voz de los consumidores” a partir de los textos de sus interacciones, predecir comportamientos y tendencias, etc.

Uno de los grandes potenciales de esta aproximación es que no sólo es valida para esos contextos a los que nos referimos cuando decimos que el Big Data es realmente “big”, sino que muchos perfiles de organización, aunque no generen diariamente terabytes de información, también generan unas cantidades de datos muy considerables, quizá no tanto por el número de elementos que registran pero sí por la multitud de variables que miden en cada registro. Cuando estas organizaciones se plantean explotarlos, encuentran en las herramientas antes mencionadas una solución muy accesible y con un rendimiento computacional mucho mejor que el de otras herramientas usadas tradicionalmente en los entornos empresariales. Esto abre la puerta del Big Data Analytics a organizaciones que quizá no se considerarían a sí mismas generadoras de tanto volumen de datos, aunque el reto evidentemente está en no poner el carro delante de los bueyes y en que sea la visión estratégica del negocio la que determine el momento y manera en que lanzar proyectos de adopción de estas tecnologías y no al revés.

No hay comentarios:

Publicar un comentario