Me pareció especialmente interesante la presentación de Uwe Seiler, representante de la sede de Frankfurt de Codecentric, formador y especialista en despliegues de Hadoop en múltiples proyectos de Big Data para diversos sectores, como la industria automovilística, la publicidad online o el sector de las finanzas (el sector estrella en Frankfurt). En su exposición dio un repaso a las principales lecciones aprendidas en torno al papel de Hadoop y su evolución dentro de los proyectos de despliegue de tecnologías Big Data en los que ha venido participando recientemente.
La charla de Seiler giró en torno a la heterogeneidad intrínseca de estos proyectos, en los que se ha ido abandonando la percepción errónea de que “Hadoop lo resuelve todo”, para pasar a entenderlo como una pieza más que cumple su función dentro de una arquitectura compleja que debe resolver diferentes casos de uso, cada uno con diferentes requisitos en cuanto al tipo de procesamiento de datos y análisis a ofrecer. De hecho todos los ejemplos que Seiler presentó eran despliegues de tecnologías Big Data siguiendo el esquema conceptual propuesto por la Arquitectura Lambda, donde se debía atender a requerimientos de explotación de datos tanto en diferido como en tiempo real.
En esta creciente necesidad de atender a la velocidad y al tiempo de respuesta como requisito en proyectos Big Data, Seiler citó la propuesta de una pila tecnológica especialmente pensada para estos casos. Se trata de la pila SMACK, acrónimo compuesto por las iniciales de las herramientas que la componen: Spark, Mesos, Akka, Cassandra y Kafka. La primera referencia proponiendo esta pila tecnológica tiene su origen en la compañía Mesosphere y su producto Infinity, que agrupa e integra en una única distribución las citadas tecnologías Big Data.
La charla de Seiler giró en torno a la heterogeneidad intrínseca de estos proyectos, en los que se ha ido abandonando la percepción errónea de que “Hadoop lo resuelve todo”, para pasar a entenderlo como una pieza más que cumple su función dentro de una arquitectura compleja que debe resolver diferentes casos de uso, cada uno con diferentes requisitos en cuanto al tipo de procesamiento de datos y análisis a ofrecer. De hecho todos los ejemplos que Seiler presentó eran despliegues de tecnologías Big Data siguiendo el esquema conceptual propuesto por la Arquitectura Lambda, donde se debía atender a requerimientos de explotación de datos tanto en diferido como en tiempo real.
En esta creciente necesidad de atender a la velocidad y al tiempo de respuesta como requisito en proyectos Big Data, Seiler citó la propuesta de una pila tecnológica especialmente pensada para estos casos. Se trata de la pila SMACK, acrónimo compuesto por las iniciales de las herramientas que la componen: Spark, Mesos, Akka, Cassandra y Kafka. La primera referencia proponiendo esta pila tecnológica tiene su origen en la compañía Mesosphere y su producto Infinity, que agrupa e integra en una única distribución las citadas tecnologías Big Data.
No hay comentarios:
Publicar un comentario