Cabecera personalizada

El blog de Mikel Niño
Emprendimiento digital, startups, Big Data Analytics y nuevos modelos de negocio

Recopilación de tutoriales online para Apache Hadoop

Siendo Apache Hadoop, como hemos visto, una de las piezas fundamentales dentro de todo el conjunto de tecnologías desarrolladas en torno al Big Data, desde su aparición ha alcanzado la suficiente madurez y popularidad como para dar pie a numerosos recursos online que nos guíen y faciliten el acercamiento a dicha herramienta. En esta entrada recopilo algunos de esos recursos y tutoriales online para nuestros primeros pasos con Apache Hadoop.

La referencia obligada para comenzar es la wiki que la Fundación Apache dedica a Hadoop, donde podemos encontrar muy diversas referencias (presentaciones, artículos, libros, ...), una lista de proyectos relacionados dentro del ecosistema Hadoop, una completa documentación tanto para usuarios como para desarrolladores y enlaces una serie de tutoriales para guiarnos paso a paso en la puesta en marcha de Hadoop.

Dentro de esos tutoriales una referencia destacada es la del ofrecido por Yahoo, dado que al fin y al cabo es la empresa donde tuvo su origen el proyecto. El tutorial de Yahoo explica con detale los fundamentos del sistema de ficheros distribuidos HDFS y los fundamentos del modelo MapReduce como base para el funcionamiento de Hadoop. Para facilitar la tarea de la puesta en marcha de Hadoop, se pone a nuestra disposición una máquina virtual ya configurada (un recurso habitual también en el resto de tutoriales disponibles sobre Hadoop) y se nos indican los pasos para crear nuestros programas para Hadoop usando el lenguaje Java (que es también en el que Hadoop está desarrollado). El tutorial también dedica una parte específica a Pig, una de las herramientas que mencionábamos dentro del ecosistema Hadoop.

Yahoo no es la única empresa implicada en proyectos de Big Data que pone a nuestra disposición materiales para acercarnos el uso de Hadoop. IBM, dentro de su proyecto Big Data University, cuenta entre otros tutoriales con uno específico sobre fundamentos de Hadoop. Otras empresas relevantes en Big Data como Cloudera o Hortonworks también cuentan con sus propios tutoriales y guías introductorias a Hadoop y herramientas relacionadas como Pig y Hive.

Para completar la lista con otras referencias que también pueden ser de interés para complementar detalles técnicos no desarrollados en las anteriores, contamos también con los tutoriales ofrecidos por TutorialsPoint, CoreServlets y Vlad Korolev.

No hay comentarios:

Publicar un comentario