Notas del meetup “Big Data, Frankfurt v 2.0”

La semana pasada acudí al meetup “Big Data, Frankfurt v2.0”, celebrado en la sede en Frankfurt de Codecentric, una empresa de desarrollo de software con múltiples sedes en Alemania. El evento estaba también impulsado por Dataconomy, un portal web radicado en Berlín especializado en la difusión de noticias y organización de eventos en torno a los avances tecnológicos para el tratamiento y análisis de datos. El evento también contó con representantes de Cloudera, una de las empresas más relevantes a nivel internacional en cuanto al desarrollo y distribución de tecnologías Big Data, y de la startup local Clark, especializada en un servicio de explotación de datos para la recomendación inteligente a usuarios sobre alternativas de seguros.

Me pareció especialmente interesante la presentación de Uwe Seiler, representante de la sede de Frankfurt de Codecentric, formador y especialista en despliegues de Hadoop en múltiples proyectos de Big Data para diversos sectores, como la industria automovilística, la publicidad online o el sector de las finanzas (el sector estrella en Frankfurt). En su exposición dio un repaso a las principales lecciones aprendidas en torno al papel de Hadoop y su evolución dentro de los proyectos de despliegue de tecnologías Big Data en los que ha venido participando recientemente.

Foto tomada por el propio Uwe Seiler durante las charlas del meetup "Big Data, Frankfurt v2.0"

La charla de Seiler giró en torno a la heterogeneidad intrínseca de estos proyectos, en los que se ha ido abandonando la percepción errónea de que “Hadoop lo resuelve todo”, para pasar a entenderlo como una pieza más que cumple su función dentro de una arquitectura compleja que debe resolver diferentes casos de uso, cada uno con diferentes requisitos en cuanto al tipo de procesamiento de datos y análisis a ofrecer. De hecho todos los ejemplos que Seiler presentó eran despliegues de tecnologías Big Data siguiendo el esquema conceptual propuesto por la Arquitectura Lambda, donde se debía atender a requerimientos de explotación de datos tanto en diferido como en tiempo real.

En esta creciente necesidad de atender a la velocidad y al tiempo de respuesta como requisito en proyectos Big Data, Seiler citó la propuesta de una pila tecnológica especialmente pensada para estos casos. Se trata de la pila SMACK, acrónimo compuesto por las iniciales de las herramientas que la componen: Spark, Mesos, Akka, Cassandra y Kafka. La primera referencia proponiendo esta pila tecnológica tiene su origen en la compañía Mesosphere y su producto Infinity, que agrupa e integra en una única distribución las citadas tecnologías Big Data.

Cabecera personalizada

Notas del meetup “Big Data, Frankfurt v 2.0”

No hay comentarios:

Publicar un comentario