Tecnologías de la web semántica - BiblogTecarios

Tecnologías de la web semántica

Tecnologías de la web semánticaNormalmente se entiende la web como un espacio de información para acceder a contenidos de todo tipo y comunicarse a través de herramientas como redes sociales, blogs o foros. Pero de forma silenciosa está surgiendo otra web, pensada para que los programas informáticos se comuniquen entre sí e intercambien datos para realizar todo tipo de tareas. Es una web para las máquinas, pero que incidirá directamente en los servicios que utilizaremos las personas: la web semántica.

A lo largo de este libro se proporcionarán conocimientos básicos sobre el concepto, el funcionamiento y la arquitectura de la web semántica, los principales estándares utilizados para la representación de la información y las aplicaciones más representativas que actualmente se desarrollan en este nuevo y apasionante entorno.

El autor define la web semántica como “la web para las máquinas”, para que se puedan comunicar entre ellas en servicios que utilizan las personas.

El libro está dirigido a los que buscan una visión y conocimiento general sobre la web semántica, su arquitectura y su funcionamiento. También ofrece  una visión general de los formatos XML, RDF, OWL o SPARQL.

El libro comienza con la historia de la tecnología, desde la creación del CD-ROM a la Web 2.0 y a la interoperabilidad semántica de las máquinas con RDF.

En realidad la web semántica viene a ser como una filosofía creada para el intercambio de datos cuya información es leída e interpretada entre máquinas, facilitando la comunicación entre el ser humano y un sistema informático. Tecnología útil sobre todo para búsqueda de información.

Todas las explicaciones se acompañan de modelos y gráficos que ilustran las definiciones y explicaciones del autor. Como por ejemplo en la siguiente figura se muestra la estructura de la web semántica y todos los elementos que la componen:

TWS

Una parte importante del libro se basa en los diferentes formatos de metadatos de la web semántica, ofreciendo explicación detallada de los elementos de cada formato, mostrando ejemplos de código de XML, DTD, RDF, OWL y SPARQL. Los metadatos es la información estructurada de la web semántica, que puede ser localizada y reutilizada de forma eficaz por otras máquinas.

Otra parte importante se complementa con el repaso de conceptos como las ontologías y sus componentes.

En la parte final, después de dar las definiciones y explicaciones fundamentales para entender la web semántica, el autor ofrece una visión más práctica, entre los casos prácticos de ejemplos se encuentran proyectos como BDPedia y Europeana, ambos basados en la obtención de datos estructurados de otros servicios web para la creación de grandes contenedores de objetos digitales.

Y como no podría faltar, también muestra la estructura de los CMS, como solución y avance hacia la web semántica, que en este caso permiten el mapeado de elementos para compartirlos con otros sistemas, pero a la vez también puede incorporar datos externos.

En resumen, la apuesta de la web semántica está en los estándares abiertos para el intercambio de contenidos y datos de todo tipo. Esto, que ya es una evidencia, abre nuevos modelos de negocios y los desarrolladores de software y diseñadores de sistemas ya trabajan en ello.

Toda la obra en sí es conceptual, para que el lector pueda entender la web semántica, aunque la persona que decide crear un depósito digital o una web no tiene que llegar a programar código fuente pero sí entender lo que hay detrás del software seleccionado, con la finalidad de tener criterios en la elección de un software u otro, según la estrategia política de la entidad, para que su repositorio o web pueda intercambiar datos con otros sistemas.

Por eso este libro ofrece todos los conceptos, lenguajes, modelos y ejemplos para conocer los requerimientos de la web semántica y participar en ella con nuestros recursos digitales.

Hablando con el autor

Los profesionales utilizarán aplicaciones para gestionar catálogos, repositorios digitales, sistemas de gestión de contenido, etc. Dichas aplicaciones se encargarán de la publicación automática en formato RDF. Los bibliotecarios, documentalistas y gestores de información únicamente tendrán que realizar sus tareas y a lo sumo definir cómo se van a publicar ciertos datos. Por eso la web semántica está funcionado: por su transparencia tanto para usuarios como para profesionales de la Información y Documentación.

Hoy en día ¿podemos encontrar en el mercado algún software que no cumpla con estos estándares de intercambio? El autor responde:

Si nos centrarnos en RDF podemos encontrar tres casos en los que la aplicación de esta tecnología aún está en proceso “experimental”:

  1. Muchos sistemas bibliotecarios especializados utilizan MARC21 (y su correspondiente esquema XML) para el intercambio de datos sin contemplar la publicación de conjuntos de datos RDF de los catálogos de un modo cómodo y controlado por los bibliotecarios. La punta de lanza está siendo la Library of Congress, que está liderando el proceso de transición bibliográfica hacia unas nuevas normas RDA, en donde se contempla el uso de MARC21 pero con un esquema RDF que permita la publicación de datos compatibles con la web semántica.
  2. La mayoría de software de repositorios digitales (como Dspace, Greenstone o especializados como OJS) no incorporan directamente soporte RDF para publicar los metadatos de los objetos que gestiona. Se hace mediante desarrollos propios o la instalación (muchas veces compleja) de módulos que no son muy satisfactorios.
  3. Los sistemas de gestión de contenidos siguen teniendo grandes carencias a este respecto. Drupal es una excepción, y aún así la planificación de la instalación de los módulos necesarios para publicar o integrar conjuntos de datos RDF puede ser algo compleja y poco transparente.

Esto hace que muchas soluciones para publicar conjuntos de datos RDF que originalmente son gestionados por otras aplicaciones se realice a través de software intermedio especializado en el almacenamiento RDF (tripletstore) como Virtuoso.

Cuando pase el tiempo muchos sistemas ya incorporaran de forma nativa la publicación RDF los datos que gestione, pero de momento esta es la situación actual.

Referencia bibliográfica

Pastor Sánchez, Juan Antonio. Tecnologías de la web semántica. Barcelona: El Profesional de la Información, 2011. 120 p. ISBN 978-84-9788-474-7

Para más información…

The following two tabs change content below.

Patricia Russo

Este blog pretende dar a conocer herramientas, experiencias, bibliografia, etc. sobre software libre aplicado a bibliotecas, además de otros temas de interés general sobre la profesión.

Latest posts by Patricia Russo (see all)

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos necesarios están marcados *