Cabecera personalizada

El blog de Mikel Niño
Emprendimiento digital, startups, Big Data Analytics y nuevos modelos de negocio

Entrevistas a "leading data scientists" a nivel internacional en el blog ODBMS.org de Roberto V. Zicari

Roberto V. Zicari (con quien he tenido el placer de colaborar en el Frankfurt Big Data Lab y preparar artículos conjuntamente) ha iniciado recientemente en su blog una serie de cuestionarios (“Q&A with data scientists”) a científicos de datos, todos ellos profesionales de dilatada carrera desempeñando puestos de responsabilidad en universidades de todo el mundo y en organizaciones como Google, Apple, IBM, GE, Thomson Reuters, SAS, PwC, etc. Semejante plantel de interlocutores hace de esta serie de entrevistas toda una mina de conocimiento de la que extraer muy valiosas aportaciones sobre la práctica de data science desde diversas perspectivas.

Mi seminario sobre Big Data enfocado a perfiles directivos

El pasado mes de febrero impartí un seminario de media jornada dentro del programa de formación para directivos de la Cámara de Comercio de Gipuzkoa (a quienes aprovecho para agradecer su propuesta de colaboración). Aparte de quedarme con muy buenas sensaciones por la acogida del seminario y el feedback recibido de asistentes y organización, la experiencia me resultó de lo más interesante y enriquecedora. Además de una numerosa asistencia, me encontré con unos asistentes muy motivados por comprender las claves del Big Data en particular y la analítica de datos en general desde el punto de vista directivo y ejecutivo. Fue sumamente enriquecedor recoger los comentarios de gerentes y directivos de organizaciones de muy diferentes sectores: banca, transporte, manufactura, seguros, turismo, educación, e-commerce, centros tecnológicos, consultoría TIC...

CRISP-DM: Fase de “Despliegue” (Deployment)

<< CRISP-DM: Evaluación

La creación del modelo y su evaluación positiva no significa el final del proyecto. Se debe organizar el conocimiento adquirido gracias al proceso de minería de datos y presentarlo de una manera que sea utilizable en el contexto de negocio. Esto implica la integración de los modelos dentro de los procesos de toma de decisiones de la organización, además de requerir la implicación del cliente en los propios pasos de puesta en operación del modelo.

Las principales tareas que engloba esta fase son las siguientes:

CRISP-DM: Fase de “Evaluación” (Evaluation)

<< CRISP-DM: Modelado

Una vez que ya hemos construido el modelo que presenta una mayor calidad desde la perspectiva del análisis de datos, y antes de pasar a su despliegue y puesta en operación, en esta fase se evalúan y revisan los pasos seguidos para tener la certeza de que el modelo cumple los objetivos de negocio planteados o si hay algún aspecto importante desde el punto de vista del contexto de negocio que no ha sido suficientemente tenido en cuenta. El objetivo final de la fase es decidir la aprobación o no del uso de los resultados del análisis de datos.

Las principales tareas contempladas en esta fase son:

CRISP-DM: Fase de “Modelado” (Modeling)

<< CRISP-DM: Preparación de los datos


En esta fase se seleccionan y aplican diferentes técnicas (algoritmos) de modelado, calibrando sus parámetros para conseguir sus valores óptimos. Para un mismo problema de minería de datos tenemos diferentes técnicas susceptibles de ser usadas y, dado que cada una de ellas puede tener requisitos diferentes en la forma en que deben presentarse los datos de entrada, es probable que sea necesario realizar ciclos adicionales de “preparación de los datos”.

Las principales tareas que abarca esta fase son las siguientes:

CRISP-DM: Fase de “Preparación de los datos” (Data Preparation)

<< CRISP-DM: Comprensión de los datos

El objetivo principal de esta fase es la construcción, a partir de los datos “en crudo”, del dataset final a utilizar como datos de entrada para las herramientas de modelado. Las tareas englobadas en esta fase (centradas en la limpieza y transformación de los datos) son susceptibles de realizarse repetidas veces y en un orden que dependerá del caso concreto.

Las principales tareas contempladas en esta fase son: