Cabecera personalizada

El blog de Mikel Niño
Emprendimiento digital, startups, Big Data Analytics y nuevos modelos de negocio

Definiendo las competencias del perfil de “data scientist”

Debido a la eclosión del Big Data y de diversos modelos de negocio dentro de diferentes sectores, uno de los perfiles profesionales que más atención está recibiendo es el de data scientist” o científico de datos (en algunas fuentes también se refieren a dicho perfil como “data analyst”), al mismo tiempo que también gana popularidad la etiqueta de data science (relajando quizá la restricción de que los datos tengan que ser realmente “big”) como aglutinador de todas las disciplinas y técnicas que juegan un papel relevante dentro de esta área. ¿Cuáles serían entonces las competencias profesionales a desarrollar y aplicar para poder desempeñar dicho perfil con solvencia? Aunque nos movemos en un terreno donde las definiciones no están escritas en piedra ni son interpretadas de la misma manera por todo el mundo, podemos hacer un primer acercamiento a dicha cuestión revisando algunas de las referencias que han tratado este aspecto.

Quizás la referencia que ha analizado el perfil de data scientist con mayor detalle es el estudio “Analyzing the Analyzers: An Introspective Survey of Data Scientist and Their Work”, elaborado por Harlan Harris, Sean Murphy y Marck Vaisman, y publicado por O’Reilly en junio de 2013. Partiendo de una encuesta respondida por más de 250 profesionales desempeñando dicho perfil, el estudio llega a identificar cinco ejes principales en los que se agrupar sus competencias: negocios, big data/aprendizaje automático, matemáticas/investigación operativa, programación y estadística. El estudio llega también a identificar cuatro subperfiles diferentes dentro del perfil global de data scientist, en función de los diferentes pesos que tienen esas cinco competencias en el perfil desempeñado (aunque en todos los casos las cinco cuentan en mayor o menor medida).

Otros informes y artículos plantean algunas diferencias respecto a las conclusiones el citado estudio, pero en general podemos detectar muchas más coincidencias e incluso un cierto patrón respecto a las competencias principales que se engloban en el perfil. Así, por ejemplo, Udacity (uno de los principales proveedores hoy en día de formación masiva online) tomando como base este artículo de su blog escrito por Dave Holtz (data scientist de Airbnb), publica en diciembre de 2014 el informe “Ultimate Skills Checklist for Your First Data Analyst Job”, donde detalla las siguientes competencias: programación, estadística, matemáticas, aprendizaje automático, “data wrangling (algo así como pelear o “vérselas” con los datos), comunicación y visualización de datos, más una última categoría descrita como “pensar como un científico de datos” que, tras ese nombre quizá demasiado confuso, engloba competencias más próximas al negocio como la gestión de proyectos y el conocimiento de la industria/sector de aplicación.

Podemos revisar también otras referencias dentro de esta línea de análisis como esta entrada escrita por Bernard Marr en el blog de DataScienceCentral, o recorridos curriculares como los descritos en DataScienceMasters o en MastersInDataScience (que a pesar de la redundancia son sitios diferentes :-) ). En todo caso, es bastante aparente un cierto consenso en las referencias apuntadas en esta entrada acerca de los dos pilares principales que sustentan el perfil del data scientist: una parte técnica basada en conocimientos dentro de las disciplinas de la matemática/álgebra, la estadística y la informática/programación/bases de datos (todo lo cual conforma las bases en las que se sustentan el Big Data y el machine learning), así como una parte de negocios que permite aplicar todo lo anterior, orientada al conocimiento de la industria/sector de aplicación, las necesidades estratégicas del negocio (para saber identificar y entender las preguntas clave que deben ser respondidas con los datos) y las habilidades para el desarrollo de proyectos y creación de productos.

No hay comentarios:

Publicar un comentario