<< CRISP-DM: Marco general |
Anteriormente he mencionado en el blog la metodología CRISP-DM (CRoss-Industry Standard Process for Data Mining) para proyectos de minería de datos, desarrollada durante la segunda mitad de la década de los 90 y cuya primera versión completa (CRISP-DM 1.0) fue publicada en 2000. El modelo de referencia de CRISP-DM se basa en un esquema de seis fases interrelacionadas. En las siguientes entradas del blog me planteo ir desgranando las claves más relevantes que CRISP-DM recoge para cada una de estas fases en su modelo de referencia, en términos de los principales objetivos y tareas genéricas de cada fase.
Fase de “Comprensión del negocio” (Business Understanding)
El cometido general de esta fase es entender los objetivos y requerimientos del proyecto desde una perspectiva de negocio y convertir este conocimiento en la definición de un problema de minería de datos y un plan preliminar para alcanzar los objetivos. Las principales tareas que engloba son las siguientes:
- Determinar los objetivos de negocio. Comprender al detalle, desde una perspectiva de negocio, qué es lo que el cliente quiere conseguir realmente. El objetivo es descubrir desde el principio factores importantes que pueden influir el resultado del proyecto. Se debe registrar la información que se conoce sobre la situación de negocio de la organización al comienzo del proyecto, así como los criterios de éxito y utilidad del resultado desde el punto de vista del negocio.
- Evaluar el contexto. Caracterizar al detalle los recursos (personas, datos, recursos de computación, software, etc.), requerimientos (alcance y calidad de los resultados, así como aspectos de seguridad y legalidad en el uso de los datos), asunciones y otros factores a considerar al determinar los objetivos y plan del proyecto (por ejemplo la gestión de riesgos y planes de contingencia). También se debe realizar un análisis comparativo de los costes del proyecto y los potenciales beneficios para el negocio si el proyecto es exitoso.
- Determinar los objetivos de minería de datos. Pasar de la enunciación de los objetivos en términos de negocio a describirlos en el plano técnico, ligado a los conceptos de minería de datos. Al igual que con los objetivos de negocio, hay que determinar unos criterios de éxito técnico e identificar quiénes son los roles dentro del proyecto que van a evaluar el cumplimiento de estos criterios.
- Generar el plan de proyecto. Es importante incluir una valoración preliminar del tipo de herramientas y técnicas que pueden requerirse en el trabajo, dado que la selección puede influir en el proyecto completo.
El cometido general de esta fase es entender los objetivos y requerimientos del proyecto desde una perspectiva de negocio y convertir este conocimiento en la definición de un problema de minería de datos y un plan preliminar para alcanzar los objetivos. Las principales tareas que engloba son las siguientes:
- Determinar los objetivos de negocio. Comprender al detalle, desde una perspectiva de negocio, qué es lo que el cliente quiere conseguir realmente. El objetivo es descubrir desde el principio factores importantes que pueden influir el resultado del proyecto. Se debe registrar la información que se conoce sobre la situación de negocio de la organización al comienzo del proyecto, así como los criterios de éxito y utilidad del resultado desde el punto de vista del negocio.
- Evaluar el contexto. Caracterizar al detalle los recursos (personas, datos, recursos de computación, software, etc.), requerimientos (alcance y calidad de los resultados, así como aspectos de seguridad y legalidad en el uso de los datos), asunciones y otros factores a considerar al determinar los objetivos y plan del proyecto (por ejemplo la gestión de riesgos y planes de contingencia). También se debe realizar un análisis comparativo de los costes del proyecto y los potenciales beneficios para el negocio si el proyecto es exitoso.
- Determinar los objetivos de minería de datos. Pasar de la enunciación de los objetivos en términos de negocio a describirlos en el plano técnico, ligado a los conceptos de minería de datos. Al igual que con los objetivos de negocio, hay que determinar unos criterios de éxito técnico e identificar quiénes son los roles dentro del proyecto que van a evaluar el cumplimiento de estos criterios.
- Generar el plan de proyecto. Es importante incluir una valoración preliminar del tipo de herramientas y técnicas que pueden requerirse en el trabajo, dado que la selección puede influir en el proyecto completo.
No hay comentarios:
Publicar un comentario