El concepto de Web Semántica ha derramado verdaderos ríos de tinta en los últimos años. Y es que la promesa de conseguir una recuperación inteligente de la información, mediante la creación de ontologías para diferentes dominios del conocimiento, vendría a resolver el importante problema que supone la infoxicación para los usuarios de Internet.
Pero, ¿qué se esconde realmente detrás de las ontologías? En el estado actual de la investigación, ¿son las ontologías realmente un medio eficaz para proporcionar una recuperación inteligente, orientada al significado, de la información?
A mi juicio, la creación de ontologías se apoya en dos principios básicos: por un lado, la generación de descripciones como medio para definir los conceptos centrales de un dominio de conocimiento; por el otro, la explicitación formal de las relaciones involucradas entre estos conceptos. En esta primera parte del post, examinaré el primero de los dos principios mencionados.Creo que la investigación relativa a la WS y a las ontologías deja bien a las claras la necesidad de un verdadero trabajo transdisciplinar: por ello, para examinar los principios mencionados más arriba, me serviré de presupuestos que provienen de la filosofía analítica (o filosofía del lenguaje), y de la psicología cognitiva. Daré por supuesto que el/la lector/a posee unos conocimientos básicos de lo que es una ontología. En caso contrario, le remito a la abundantísima bibliografía disponible sobre el tema.
COmencemos, pues, con el primer principio: a generación de descripciones como medio para definir los conceptos centrales de un dominio de conocimiento.
¿Qué es un concepto? Aunque esta es una pregunta compleja, una de las respuestas más frecuentes es, siguiendo al científico cognitivo Paul Thagard, que los conceptos son representaciones de individuos o situaciones típicas, y no definiciones en sentido estricto (Thagard, 2008, p. 103).
Utilizando un ejemplo del mismo Thagard, los estudiantes adquieren el concepto “asignatura”, según el cual un docente imparte conocimiento y un grupo de alumnos asisten a clase, realizan una serie de trabajos prácticos y exámenes y obtienen una calificación determinada (Thagard, 2008, p. 103). Por tanto, los alumnos sintetizan en un conjunto de “casillas” la información referente a una asignatura particular: casillas tales como nombre, docente, aula, horario, modalidad de evaluación,…
Como se puede ver, esta caracterización de qué es un concepto se reproduce en las ontologías, donde los conceptos de un área determinada del conocimiento son tratados como representaciones con una serie de casillas (“slots”), que se tienen que llenar con información específica.
No obstante, en el contexto de un dominio de conocimiento, los conceptos sí se asimilan a definiciones estrictas, ya que la función de las ontologías es precisamente explicitar los conceptos centrales de un dominio. Esto se consigue mediante el uso de los “slots”, pero también gracias a la disposición jerárquica de los conceptos, que permite la herencia de propiedades (Thagard, 2008, p. 107): si utilizamos un ejemplo trivial, si un gato es un felino, y los felinos son vertebrados, entonces un gato es un vertebrado.
Dado que en las estructuras ontológicas se busca generar definiciones (mediante los slots y la herencia de propiedades) de los conceptos implicados, podemos asumir que aquello que se pretende es asimilar el significado de los conceptos a descripciones asociadas a los mismos. Y sobre esta asunción podemos realizar dos objeciones:
En primer lugar, no es necesario, ni plausible, presuponer que los hablantes/usuarios dispongan de definiciones que puedan asociar a priori (independientemente de la experiencia) a los conceptos de un determinado dominio de conocimiento. Y, a pesar de esto, como hablantes/usuarios competentes de la terminología utilizada en el dominio, pueden utilizar los términos asociados a los conceptos de manera eficiente para sus necesidades comunicativas.
EN segundo lugar, la entidad o idea a la que apunta el concepto (denominada «referente», en la terminología de la filosofía analítica) puede venir determinada por la existencia de una cadena causal comunicativa. En otras palabras, los términos utilizados para nombrar los conceptos serian transmitidos dentro de los miembros de una comunidad mediante una cadena de comunicación.
Aclararé estas ideas con un ejemplo adaptado de Marcia Bates . Un usuario no especializado quiere encontrar información sobre los tratamientos paliativos del cáncer, dado que un familiar padece esta enfermedad. De hecho, pero, su familiar padece una variante concreta de cáncer, con una alta prevalencia en su lugar de residencia. No obstante, para el usuario la variedad en cuestión se identifica simplemente con el término “cáncer”, y no con ninguna definición concreta relacionada con el término que utiliza para su búsqueda (por ejemplo, “carcinoma originado en las células que constituyen el revestimiento interno de las glándulas de secreción externa”). Además, la referencia de su término de búsqueda (“cáncer”) puede estar determinada de manera plausible por una cadena causal comunicativa: el uso que el usuario realiza del término en cuestión remite a otros usos que se han hecho del término en documentos a los que el usuario ha tenido acceso, o al uso que otras personas con las que el usuario ha tenido contacto hacen del mismo término.
Se podrían realizar dos críticas a mis objeciones al primer principio de las ontologías, mostradas con el ejemplo anterior: la primera, que el usuario en cuestión no es un hablante competente de los términos del dominio de conocimiento en cuestión; la segunda, que el ejemplo es ciertamente artificioso, ya que es poco probable que un usuario en esta situación no sepa realmente qué está buscando.
Creo que la primera crítica es una restricción demasiado fuerte al uso que de los términos representativos de los conceptos de un dominio podemos realizar como hablantes competentes de una lengua: ¿cuántas definiciones concretas podríamos asociar a los conceptos que utilizamos en nuestras búsquedas de información? Probablemente pocas. Desde el punto de vista de un profesional, el uso poco preciso de los conceptos de un dominio puede representar un desconocimiento flagrante del ámbito, pero no podemos negar que este fenómeno puede ser perfectamente compatible con el hecho que este uso ilícito pueda ser informativo para el usuario: considerando el ejemplo anterior, la proferencia de “Josep tiene cáncer” informa a nuestro usuario que, efectivamente, un familiar suyo (Josep) tiene cáncer, independientemente que quien informa al usuario, o el usuario mismo, pueda asociar una descripción al término “cáncer” .
Si, no obstante, se quisiera continuar defendiendo la crítica antes presentada (que los usuarios que no pueden asociar descripciones “correctas” a los conceptos de un dominio no son usuarios competentes de la terminología del dominio), nos tendríamos que preguntar si, con esta afirmación, no estamos limitando el uso de las ontologías a comunidades restringidas y especializadas de usuarios, excluyendo así al público no especializado de las potencialidades de la Web Semántica.
La segunda crítica (que es poco plausible suponer que los usuarios no sepan realmente qué están buscando), me parece menos justificada que la primera: aquello que es poco plausible suponer es que, en búsquedas no factuales, los usuarios tengan una idea clara y unívoca de aquello que buscan. Obviar la serendípia, el aprendizaje asociativo, el browsing,… implica, por un lado, obviar una parte importantísima de los fenómenos cognitivos asociados a la búsqueda on line y, por el otro, presentar una idea reduccionista de los juicios sobre la pertinencia de los resultados de una búsqueda determinada que realizan los usuarios, juicios afectados por factores emocionales, por la disponibilidad o no de tiempo, por las expectativas previas a la búsqueda… (Davies, 2005).
No es extraño, pues, que haya voces que proclamen la necesidad de tener en cuenta en la siguiente generación de Internet no sólo la semántica, sino también la pragmática, esto es, el contexto del usuario que realiza la búsqueda de información: en este sentido, encontramos obras como The Turn: integration of information seeking and retrieval in context, de Peter Ingwersen y Kalervo Järvelin (Ingwersen, Järvelin, 2005).
Lo expuesto en este post no debería entenderse como una crítica a priori sobre la utilidad de las ontologías en la organización y la recuperación de la información. Ni mucho menos como un alegato en contra de la posibilidad de que la Web Semántica llegue a convertirse algún dia en realidad. Más bien, lo que he querido mostrar es que mediante un conocimiento más profundo de los procesos cognitivos mediante los cuáles los usuarios buscamos, utilizamos e interpretamos la información, podemos mejorar sustancialmente la calidad de los sistemas de organización y recuperación de la información que los bibliotecarios-documentalistas podemos ofrecer a nuestros usuarios.
Bibliografía
Davies, Clare. Finding and knowing : psychology, information and computers. London; Routledge, cop. 2005. XI, 327 p. ISBN 0851424546.
Ingwersen, Peter; Järvelin, Kalervo. The Turn : integration of information seeking and retrieval in context. Dordrecht; Springer, cop. 2005. XIV, 448 p. ISBN 140203850X.
Thagard, Paul. La Mente: introducción a las ciencias cognitivas. Madrid [etc.]; Katz, 2008. 379 p. ISBN 978-84-96859-21-0.