Ahora que el concepto de "Big Data" es una de las tendencias predominantes en la aplicación de las tecnologías digitales en muy diversos sectores, y con noticias recientes como la del lanzamiento del "Laboratory for Social Machines" del MIT, apoyado financiera y logísticamente por Twitter, para el análisis de la semántica y los patrones detectables en las ingentes cantidades de datos que provienen de nuestra interacción en los medios sociales, parece un buen momento para abordar el concepto de "Web Semántica" (que engloba varias de las técnicas utilizadas en el mundo del "Big Data") y presentar algunos de los principios en los que se fundamenta dicha propuesta.
La adopción y uso masivo de servicios vía web hace que las contribuciones de las que se alimenta la web vengan de muy diferentes tipos de fuentes, siguiendo un esquema de “comunidad abierta” en el que cualquiera puede contribuir y cualquiera puede acceder a dichas contribuciones. Debido a esta variedad de origen y calidad en esas “piezas de información”, si queremos aprovecharlas de manera conjunta surge la necesidad de un mecanismo que permita acceder a esa información explotando adecuadamente su interrelación y evitando inconsistencias, para poder aprovechar todos esos recursos de manera más inteligente y evitar trabajos manuales muy costosos.
La idea de Web Semántica nace como una propuesta de solución a dicha necesidad. El enfoque de dicha propuesta no trata de "reestructurar la web" para que sea más inteligente, sino que plantea añadir a la infraestructura web existente los elementos necesarios que mejoren la manera en que se representa la información (buscando añadir una capa de consistencia e interrelación de datos), de manera que se puedan construir aplicaciones (en cierto sentido "inteligentes") que aprovechen y saquen el máximo partido a esa infraestructura mejorada. Dicho de otra manera, la propuesta de la Web Semántica no pretende que exista una gestión centralizada de cómo deben almacenarse los datos (lo que iría en contra del esquema distribuido de la Web). Se mantiene el elemento clave de que las contribuciones vienen de diferentes orígenes, pero se maneja una infraestructura que permite que unas contribuciones (sus datos) sean combinables con otras.
La clave de esta mejora pasa por representar los datos de una manera que, más allá de que puedan ser utilizables por las personas (que es el enfoque habitual de lo que se publica en la web, pensada para presentar "documentos" interenlazados que son comprensibles por personas), haga explícitas las características de dichos datos que hacen que sean explotables por máquinas, describiendo diferentes entidades y sus relaciones, identificando cada recurso mediante URIs. Es aquí donde surgen diversos estándares (RDF, RDFS, OWL, ...) dentro de la Web Semántica, que implementan formalismos para representar esos recursos de manera que las aplicaciones puedan explotarlos de manera interconectada.
[See here for the English version of this entry]
La idea de Web Semántica nace como una propuesta de solución a dicha necesidad. El enfoque de dicha propuesta no trata de "reestructurar la web" para que sea más inteligente, sino que plantea añadir a la infraestructura web existente los elementos necesarios que mejoren la manera en que se representa la información (buscando añadir una capa de consistencia e interrelación de datos), de manera que se puedan construir aplicaciones (en cierto sentido "inteligentes") que aprovechen y saquen el máximo partido a esa infraestructura mejorada. Dicho de otra manera, la propuesta de la Web Semántica no pretende que exista una gestión centralizada de cómo deben almacenarse los datos (lo que iría en contra del esquema distribuido de la Web). Se mantiene el elemento clave de que las contribuciones vienen de diferentes orígenes, pero se maneja una infraestructura que permite que unas contribuciones (sus datos) sean combinables con otras.
La clave de esta mejora pasa por representar los datos de una manera que, más allá de que puedan ser utilizables por las personas (que es el enfoque habitual de lo que se publica en la web, pensada para presentar "documentos" interenlazados que son comprensibles por personas), haga explícitas las características de dichos datos que hacen que sean explotables por máquinas, describiendo diferentes entidades y sus relaciones, identificando cada recurso mediante URIs. Es aquí donde surgen diversos estándares (RDF, RDFS, OWL, ...) dentro de la Web Semántica, que implementan formalismos para representar esos recursos de manera que las aplicaciones puedan explotarlos de manera interconectada.
[See here for the English version of this entry]
No hay comentarios:
Publicar un comentario