Cabecera personalizada

El blog de Mikel Niño
Emprendimiento digital, startups, Big Data Analytics y nuevos modelos de negocio

CRISP-DM: Fase de “Despliegue” (Deployment)

<< CRISP-DM: Evaluación

La creación del modelo y su evaluación positiva no significa el final del proyecto. Se debe organizar el conocimiento adquirido gracias al proceso de minería de datos y presentarlo de una manera que sea utilizable en el contexto de negocio. Esto implica la integración de los modelos dentro de los procesos de toma de decisiones de la organización, además de requerir la implicación del cliente en los propios pasos de puesta en operación del modelo.

Las principales tareas que engloba esta fase son las siguientes:

CRISP-DM: Fase de “Evaluación” (Evaluation)

<< CRISP-DM: Modelado

Una vez que ya hemos construido el modelo que presenta una mayor calidad desde la perspectiva del análisis de datos, y antes de pasar a su despliegue y puesta en operación, en esta fase se evalúan y revisan los pasos seguidos para tener la certeza de que el modelo cumple los objetivos de negocio planteados o si hay algún aspecto importante desde el punto de vista del contexto de negocio que no ha sido suficientemente tenido en cuenta. El objetivo final de la fase es decidir la aprobación o no del uso de los resultados del análisis de datos.

Las principales tareas contempladas en esta fase son:

CRISP-DM: Fase de “Modelado” (Modeling)

<< CRISP-DM: Preparación de los datos


En esta fase se seleccionan y aplican diferentes técnicas (algoritmos) de modelado, calibrando sus parámetros para conseguir sus valores óptimos. Para un mismo problema de minería de datos tenemos diferentes técnicas susceptibles de ser usadas y, dado que cada una de ellas puede tener requisitos diferentes en la forma en que deben presentarse los datos de entrada, es probable que sea necesario realizar ciclos adicionales de “preparación de los datos”.

Las principales tareas que abarca esta fase son las siguientes:

CRISP-DM: Fase de “Preparación de los datos” (Data Preparation)

<< CRISP-DM: Comprensión de los datos

El objetivo principal de esta fase es la construcción, a partir de los datos “en crudo”, del dataset final a utilizar como datos de entrada para las herramientas de modelado. Las tareas englobadas en esta fase (centradas en la limpieza y transformación de los datos) son susceptibles de realizarse repetidas veces y en un orden que dependerá del caso concreto.

Las principales tareas contempladas en esta fase son:

CRISP-DM: Fase de “Comprensión de los datos” (Data Understanding)

<< CRISP-DM: Comprensión del negocio

En esta fase el objetivo principal es poder hacer una captura inicial de los datos a analizar para familiarizarse con ellos, identificar problemas de calidad en los mismos, detectar subconjuntos de los datos que pudieran ser interesantes para formular hipótesis específicas que validar posteriormente con el análisis, e incluso identificar las primeras claves del conocimiento que se puede extraer de los datos.

Las principales tareas que engloba son las siguientes:

CRISP-DM: Fase de “Comprensión del negocio” (Business Understanding)

<< CRISP-DM: Marco general

Anteriormente he mencionado en el blog la metodología CRISP-DM (CRoss-Industry Standard Process for Data Mining) para proyectos de minería de datos, desarrollada durante la segunda mitad de la década de los 90 y cuya primera versión completa (CRISP-DM 1.0) fue publicada en 2000. El modelo de referencia de CRISP-DM se basa en un esquema de seis fases interrelacionadas. En las siguientes entradas del blog me planteo ir desgranando las claves más relevantes que CRISP-DM recoge para cada una de estas fases en su modelo de referencia, en términos de los principales objetivos y tareas genéricas de cada fase.