After the lecture I gave last June to open the conference held in San Sebastián on Big Data applications for businesses, the editors of the journal "DYNA New Technologies" contacted me to ask for a collaboration paper, where I could gather the key ideas presented during my lecture. After organizing my notes using a temporal guiding thread, and after the usual reviewing milestones, my paper "Understanding Big Data: antecedents, origin and later development" was published.
Cabecera personalizada
El blog de Mikel Niño
Industria 4.0, Big Data Analytics, emprendimiento digital y nuevos modelos de negocio
Industria 4.0, Big Data Analytics, emprendimiento digital y nuevos modelos de negocio
Mostrando entradas con la etiqueta hdfs. Mostrar todas las entradas
Mostrando entradas con la etiqueta hdfs. Mostrar todas las entradas
My paper "Understanding Big Data: antecedents, origin and later development"
After the lecture I gave last June to open the conference held in San Sebastián on Big Data applications for businesses, the editors of the journal "DYNA New Technologies" contacted me to ask for a collaboration paper, where I could gather the key ideas presented during my lecture. After organizing my notes using a temporal guiding thread, and after the usual reviewing milestones, my paper "Understanding Big Data: antecedents, origin and later development" was published.
Mi artículo “Entendiendo el Big Data: antecedentes, origen y desarrollo posterior”
Tras la ponencia que impartí el pasado mes de junio en la jornada organizada en San Sebastián sobre Big Data para los negocios, los responsables de la revista técnico-científica “DYNA New Technologies” se pusieron en contacto conmigo para solicitarme una colaboración en forma de artículo, donde recogiese las ideas principales de lo expuesto en dicha ponencia. De la organización de mis notas y su desarrollo en un hilo conductor histórico, y tras pasar los convenientes ciclos de revisión durante los últimos meses, nace el artículo “Entendiendo el Big Data: antecedentes, origen y desarrollo posterior” cuya reciente publicación anuncio y comparto en esta entrada de blog.
[Visita guiada] Big Data: origen y tecnologías principales
- Para comenzar, ten a mano el siguiente cronograma de antecedentes, origen y desarrollo del Big Data [ver entrada], que te será de utilidad a modo de mapa de la visita guiada
- Revisa la definición de los principales términos clave en torno al análisis de datos [ver entrada], conceptos que iremos desarrollando a lo largo de la visita guiada. Repasa también la evolución histórica de la relevancia que han tenido dichos términos [ver entrada]
¿Es realmente Big Data todo el "Big Data"?
Apache Pig: consulta y procesamiento de Big Data semi-estructurado
Otra de las herramientas que rodean a Apache Hadoop para facilitar el procesamiento de Big Data es Apache Pig, una plataforma de código abierto inspirada en lo que Google concibió y divulgó en su día como Sawzall. En cierta manera podríamos categorizarla en el mismo grupo que Apache Hive, ya que Pig también nos permite definir una serie de transformaciones y consultas sobre Big Data sin tener que programar directamente sobre el modelo MapReduce, sino manejando un lenguaje (en este caso Pig Latin) que nos permite trabajar en un nivel más abstracto, aunque Hive y Pig difieren en la manera en que realizan ese modelado y transformación abstractos de los datos.
Etiquetas:
apache-hadoop,
apache-hive,
apache-pig,
big-data,
database,
hdfs,
hiveql,
map-reduce,
open-source,
pig-latin,
technology-stack
Apache Hive: una visión "más SQL" del procesamiento de Big Data
Etiquetas:
apache-hadoop,
apache-hive,
big-data,
database,
hdfs,
hiveql,
map-reduce,
open-source,
technology-stack
¿Por qué se reduce la barrera económica para acceder a las tecnologías Big Data?
En el análisis que hacíamos de los aspectos clave de los negocios basados en Big Data comentábamos cómo, en el caso concreto de la tecnología, la barrera económica se había hecho menos exigente con estos nuevos desarrollos y con las soluciones asequibles de cloud computing existentes. En primera instancia uno podría pensar que es un cierto contrasentido ya que, si de lo que se trata es de procesar unas cantidades de datos tan grandes que las máquinas convencionales no pueden explotarlos eficientemente, la intuición parece decirnos que lo que entonces haría falta es invertir en “supermáquinas” (más potentes y más caras) para conseguirlo. Vamos a ver como las tecnologías Big Data se basan en un esquema de solución que evita ese inconveniente.
Etiquetas:
apache-hadoop,
big-data,
cloud-computing,
google-file-system,
hdfs,
iaas,
map-reduce,
paas,
technology-stack
Recopilación de tutoriales online para Apache Hadoop
Etiquetas:
apache-hadoop,
apache-hive,
apache-pig,
apache-software-foundation,
big-data,
cloudera,
hdfs,
hortonworks,
ibm,
map-reduce,
technology-stack,
yahoo
Claves del funcionamiento de un sistema de ficheros distribuidos (GFS, HDFS)
Etiquetas:
apache-hadoop,
big-data,
google-file-system,
hdfs,
map-reduce,
technology-stack
Cómo surgió Apache Hadoop, la implementación de código abierto de MapReduce
Etiquetas:
apache-hadoop,
apache-license,
big-data,
cloudera,
doug-cutting,
google,
google-file-system,
hdfs,
map-reduce,
yahoo
Suscribirse a:
Entradas (Atom)