Cabecera personalizada

El blog de Mikel Niño
Emprendimiento digital, startups, Big Data Analytics y nuevos modelos de negocio

El carácter exploratorio y de "descubrimiento" de los proyectos de análisis predictivo de datos

Al hablar de los diferentes enfoques en los que podemos clasificar la analítica de datos (descriptiva, predictiva o prescriptiva), hemos destacado el principal interés que despiertan los proyectos de analítica predictiva debido al valor adicional que ofrece la detección temprana de las situaciones de negocio que se precisen controlar. Sin embargo, en muchos (demasiados) discursos de “venta del Big Data” se presta exclusiva atención a este valor adicional, sin hacer hincapié en su carácter de potencial y simplificando en exceso la complejidad inherente a estos proyectos.

Por un lado debemos destacar lo incierto de la exploración de los datos en busca de patrones o modelos predictivos que aplicar en el contexto de negocio que en cada caso sea pertinente. Ese carácter exploratorio se basa principalmente en que, en la mayoría de las ocasiones, partimos de una situación en la que se tiene una ligera idea (a veces más un deseo genérico que un objetivo cuantificable) de lo que nos gustaría encontrar en términos de negocio. Sin embargo, en términos del resultado concreto a obtener del análisis de datos, hay que tener en cuenta que no partimos de una traducción precisa de dicha idea en términos de qué resultado analítico debemos obtener, ni de las técnicas más indicadas para obtenerlo, ni siquiera de la garantía de que los datos con los que contamos sean los más adecuados para obtener ese “oro” que queremos descubrir, ¡o incluso de que nuevos datos mejoren la posibilidad de obtenerlo!

De hecho, el concepto originalmente acuñado a finales de los 80 de Knowledge Discovery in Databases ya enmarcaba este tipo de proyectos como una labor eminentemente de “descubrimiento”, en la que vamos “explorando” el potencial de los datos y afinamos incrementalmente, mediante sucesivas exploraciones, el conocimiento que tenemos sobre los datos y su potencial real, así como la necesidad de recoger más datos o nuevas variables no contempladas inicialmente. No sólo eso, sino que esa misma exploración es la que permite afinar el objetivo que nos planteamos y, en muchas ocasiones, incluso descubrir nuevos objetivos que no habían aflorado aún al empezar a trabajar con los datos. Estos fundamentos siguen siendo los mismos en la actualidad, independientemente de que ahora vivamos esa segunda juventud de la analítica predictiva y el machine learning, propiciada por el auge del Big Data.

Esta reflexión permite ilustrar claramente el grado adicional de complejidad de estos proyectos respecto a otros más extendidos hasta ahora en el ámbito TIC. Esta complejidad se deriva del conjunto de competencias (técnicas y de negocio) que hace falta integrar y coordinar para abordar con garantías un proyecto de este tipo. Igualmente, esta identificación de competencias clave no es nueva y se remonta al origen mismo del concepto de data science a principios de milenio. La popularización de la etiqueta “Big Data” y muchos de los discursos de venta que se hacen en torno a ella no deberían impedirnos ver más allá y poder ajustar mejor las expectativas sobre su potencial real y la complejidad al explorar estas soluciones.

No hay comentarios:

Publicar un comentario