Web… ¿Semántica? (Segunda parte)

Web semánticaLas ontologías aplicadas a la recuperación de la información se apoyan sobre dos principios teóricos básicos: por un lado, la generación de descripciones como medio para definir los conceptos centrales de un dominio de conocimiento: por el otro, la explicitación formal de las relaciones involucradas entre estos conceptos.

La primera parte de este post estuvo dedicada al primero de estos principios. En esta segunda (y última) parte, me propongo inspeccionar el segundo de los principios mencionados: la explicitación de las relaciones entre conceptos.

Dos aclaraciones previas. En primer lugar, tal y como hice en la primera parte, tendré en cuenta las teorías y los resultados experimentales de la psicología cognitiva que más directamente se relacionen con mi interés.

En segundo lugar, inevitablemente esta segunda parte será algo más extensa que la primera, puesto que viene a cerrar un ciclo y es necesaria una conclusión general. Hechas las aclaraciones, comencemos.

Consideremos un ejemplo aparentemente trivial de concepto, representado por el término “árbol”. Una buena parte de los psicolingüístas afirma que los conceptos se pueden definir en función de unas características o atributos comunes: en el caso del concepto “árbol”, algunos de sus atributos pueden ser “poseer ramas”, “poseer raíces”, “poseer hojas o acículas”…

En torno a la idea de los atributos conceptuales surgieron dos teorías, que llamaremos, siguiendo a Reeves, Hirsh-Pasek y Golinkoff, “enfoque clásico” y “teoría del parecido de familia” (Reeves, Hirsh-Pasek, Golinkoff, 2001, p. 204): ambas teorías se plantean determinar qué atributos son necesarios para la definición de un determinado concepto, pero, como veremos, sus conclusiones son divergentes.

El enfoque clásico mantiene que los conceptos tienen una serie de atributos necesarios y suficientes: esto quiere decir que para que un determinado fenómeno del mundo real sea incluido en una categoría conceptual ha de poseer ciertas características, y que si un determinado fenómeno posee ciertas características tiene que ser incluido en una categoría conceptual predeterminada.

Pensemos en el concepto «triángulo»: todos los triángulos son figuras cerradas, tienen tres lados y la suma de sus ángulos es equivalente a 180 grados. Así, todos los triángulos han de tener necesariamente estos atributos para ser considerados como tales, y la presencia de estos atributos es suficiente para considerar a una determinada figura geométrica como una instancia del concepto “triángulo” (Reeves, Hirsh-Pasek, Golinkoff, 2001, p. 205).

Ahora bien, si aceptamos la teoría clásica deberíamos ser capaces de encontrar los atributos suficientes y necesarios que son específicos de cada concepto. Utilicemos el ejemplo clásico del concepto «ave»: ¿cuáles pueden ser los atributos suficientes y necesarios para considerar un determinado animal como representante del concepto “ave”? Si reflexionamos sobre nuestra experiencia cotidiana, podríamos proponer los siguientes atributos: “poseer plumas”, “volar”, “cantar”, “poner huevos”,…

No obstante, hay miembros de la categoría conceptual “ave” que no presentan todos estos atributos y, ciertamente, son aves: por ejemplo, un pingüino no vuela y no canta (si entendemos “cantar” en su sentido típico). Es decir, hay miembros que no comparten de forma suficiente y necesaria los atributos que se supone que define la categoría conceptual a la cual pertenecen y, no obstante, son miembros de pleno derecho de la misma.

Aún así, sí que parece característico de las aves presentar ciertos atributos como los mencionados más arriba (“poseer plumas”, “volar”, “cantar”, “poner huevos”,…), aunque ciertos de sus miembros no los presenten de forma obligatoria, Es decir, no parecen haber atributos necesarios y suficientes para el concepto “ave” (y, en general para cualquier categoría conceptual natural), pero sí que parecen haber atributos característicos para la misma (Reeves, Hirsh-Pasek, Golinkoff, 2001, p. 206).

Estas evidencias llevaron a postular a las psicólogas Eleanor Rosch i Carolyn Mervis su teoría del parecido de familia, una noción que se remonta al filósofo Ludwig Wittgenstein: las ejemplificaciones de un concepto no comparten un conjunto de atributos o rasgos necesarios y suficientes, sino que pueden coincidir en algunos de éstos, pero no en otros.

Esta afirmación implica que determinadas ejemplificaciones de una categoría conceptual son más representativas que otras al presentar un mayor número de los atributos característicos propios de la categoría: son los llamados prototipos. De esta forma, las categorías conceptuales presentan una estructura graduada a medida que sus representantes dejan de presentar atributos característicos (Reeves, Hirsh-Pasek, Golinkoff, 2001, p. 206). Continuando con el ejemplo de la categoría “ave”, piense el lector en un representante de la categoría. Posiblemente éste ha sido “paloma”, “gorrión”, u otras aves parecidas, y no “pingüino” o “buitre”: los dos primeros son casos prototípicos de la categoría, al presentar los atributos más característicos de ésta, mientras que los dos últimos no lo son.

Si bien la teoría de Mervin y Rosch ha tenido una amplia aceptación, no está exenta de dificultades: la teoría del parecido de familia esta fuertemente basada en los atributos perceptuales, pero hay propuestas alternativas que mantienen que la categorización y el conocimiento de los conceptos se basa en algo más que en rasgos perceptivos (Reeves, Hirsh-Pasek, Golinkoff, 2001, p. 210).

Un problema grave de la teoria del parecido de familia es clarificar qué rasgos perceptuales habrían de ser escogidos para representar un concepto. El psicólogo cognitivo Lawrence Barsalou postuló que esta cuestión depende del tipo de tarea en la que participa el sujeto, así como de su contexto (Reeves, Hirsh-Pasek, Golinkoff, 2001, p. 210).

Esto implica que no todas las categorías conceptuales que poseemos se encuentran “fijadas” en la memoria a largo plazo independientemente de la tarea y del contexto, sino que ciertas categorías conceptuales se pueden generar de una manera ad hoc: estas estructuras se generarían “espontáneamente” para apoyar la consecución efectiva de la tarea (Barsalou, en premsa).

Cuando las categoría ad hoc son utilizadas frecuentemente, también llegan a ser familiares y pueden ser fijadas en la memoria a largo plazo. El mismo Barsalou ofrece ejemplos que pueden parecer triviales, pero que son muy ilustrativos de este fenómeno: así, la categoría “objetos que guardar en una maleta” es una categoría ad hoc la primera vez que una persona se hace la maleta y emprende un viaje, pero, después de diversos viajes, esta categoría se establece en la memoria (Barsalou, en prensa).

Un aspecto muy interesante es que, según Barsalou, las categorías ad hoc representan un subconjunto de las categorías de rol, donde los roles proporcionan argumentos para verbos, relaciones y esquemas. Así, algunas categorías de rol son tan familiares que quedan perfectamente lexicalizadas y fijadas en la memoria; utilizando otro ejemplo de Barsalou, “vendedor”, “comprador”, “mercancía” y “pago” son los nombres que corresponden a los roles involucrados en la acción “comprar”. No obstante, cuando la conceptualización de un rol es nueva, se genera una categoría ad hoc: así, “vendedores potenciales de guitarras de gypsy jazz” puede perfectamente generar una categoría ad hoc (Barsalou, en prensa).

Así, Barsalou mantiene que el cumplimiento de objetivos y tareas requiere la constante especificación e instanciación de roles necesarios para su consecución: cuando una categoría de rol bien establecida no existe a tal efecto, una categoría ad hoc se genera para representarla (Barsalou, en prensa).

Y después de este excurso por la psicología cognitiva, volvamos a la Biblioteconomía y Documentación (si el lector está interesado en saber más sobre la noción de «concepto», puede consultar mi propio preprint en el repositorio E-LIS).

En el ámbito anglosajón existe una amplia tradición de investigadores relacionados con las ciencias de la documentación y con la psicología cognitiva que han intentado clarificar cuáles son los mecanismos cognitivos implicados en aquello que conocemos como “necesidad de información”.

La psicóloga Clare Davies, en su libro Finding and knowing (Davies, 2005, p.38-84), realiza un recorrido por algunas de estas teorías, entre las que destacan las de Nicolas Belkin (Anomalous State of Knowledge, o ASK), Brenda Dervin (Sense-making) y Carol Kuhlthau (Seeking meaning).

Lo interesante de la exposición de Davies no es la variedad de modelos que intentan dar respuesta a una misma pregunta (¿por qué queremos información?), sino la variedad de factores que se encuentran implicados en las necesidades de información: el tiempo, el estado emocional, la tarea concreta a realizar, el contexto en el que se desarrolla la tarea, aquello que ya se conoce antes de comenzar la búsqueda, las expectativas que el usuario tiene sobre el sistema,…

Realmente, estas apreciaciones no son nuevas para la comunidad de bibliotecarios-documentalistas: es un hecho aceptado que el juicio sobre la precisión de los resultados obtenidos en una búsqueda sólo es competencia del usuario final, dado que su necesidad de información está determinada (o puede estarlo) por los factores mencionados más arriba (entre otros).

No deja de ser sorprendente que, contando con este conocimiento, la promesa de las ontologías de aumentar la precisión mediante la explicitación de las relaciones entre los conceptos de un dominio del conocimiento haya causado tanto impacto.

Y no porque esta promesa no sea un objetivo digno de un serio estudio científico, sino porque implica determinar a priori, des del punto de vista del experto (ya sea un bibliotecario-documentalista o un informático) cuáles son las relaciones conceptuales que determinan que los resultados de una determinada búsqueda sean pertinentes o no. Y eso es precisamente aquello que nuestras intuiciones nos dicen que no se puede hacer.

Davies expone esta idea con los estudios de Nicholas y Sue sobre usuarios sujetos a la presión de obtener resultados en un tiempo limitado en búsquedas en bases de datos (Davies, 2005, p. 58-59): en estas condiciones, los juicios sobre la relevancia y la precisión parecían redundantes, ya que los usuarios querían la información “correcta” independientemente de la cantidad de documentos dejados de recuperar o de cuántos documentos “incorrectos” habían recuperado.

La variabilidad que afecta a los juicios sobre la pertinencia también queda reflejada en el hecho que, en las búsquedas temáticas, a veces aquello que se necesita no es exactamente una respuesta “correcta” o “positiva”, sino una perspectiva diferente sobre el tema en cuestión (Davies, 2005, p. 58-59).

Como hemos visto, Barsalou opina que las categorías ad hoc, como subconjunto de las categorías de rol, proporcionan argumentos para las relaciones entre conceptos. Es plausible suponer que, al menos en algunos tipos de búsqueda temática, nuestras categorizaciones y conceptualizaciones del mundo fijadas en la memoria a largo plazo den paso a categorizaciones y conceptualizaciones ad hoc.

Creo que la teoría de Barsalou correlaciona muy positivamente con la constatación que los juicios sobre la precisión pueden ser afectados por factores diversos, precisamente porque estos pueden actuar como “catalizadores” de una conceptualización ad hoc del mundo en general, y de los productos documentales en particular. Y esto en virtud de representar la tarea y el contexto propio del usuario: y, como hemos visto, el establecimiento de relaciones conceptuales no es independiente de la tarea ni del contexto particular del usuario.

Finalizado el análisis del segundo principio teórico sobre el que se fundamentan las ontologías, ¿podríamos extraer alguna conclusión global de estos dos artículos?

Ya hace unos 50 años que la ciencia cognitiva se estableció de manera “oficial” como ámbito autónomo del conocimiento. Ésta no puede entenderse como una disciplina, sino más bien como una federación de disciplinas que incluye la filosofía de la mente y el lenguaje, la psicología, la antropología, las ciencias de la computación,…

No obstante, en mayor o en menor medida todas estas disciplinas relacionadas han adoptado la metáfora del ordenador como modelo explicativo de la cognición humana y de los procesos psicológicos involucrados, Y tanto ha sido así que desde aquella fecha capital de 1956 se han propuesto numerosos modelos teóricos que han querido formalizar el pensamiento humano.

En palabras de los científicos cognitivos Gilles Fauconnier y Mark Turner, vivimos en la era del triunfo de la forma (Fauconnier, Turner, 2002, p.3): no sólo en el ámbito de las ciencias cognitivas se ha producido esta formalización, sino que:

«In mathematics, physics, music, the arts, and the social sciences, human knowledge and its progress seem to have been reduced in startling and powerful ways to a matter of essential formal structures and their transformations» (Fauconnier, Turner, 2002, p.3).

Si bien es indudable e indiscutible los avances que esta formalización del mundo han supuesto para los modelos explicativos de la realidad con que ahora contamos, Fauconnier y Turner también nos alertan de un fenómeno ligado a la formalización: nuestra capacidad para elaborar formalizaciones que explican y manipulan la realidad de forma satisfactoria nos ha llevado a la creencia que la forma es el significado, cuando en realidad el significado es el resultado de una compleja serie de procesos mentales:

«[…] we in the twenty-first century have come to realize that the miracles of form harness the unconscious and usually invisible powers of human beings to construct meaning. […] Form does not present meaning but instead picks out regularities that run throught meanings […] having the form –and indeed even the intrincate transformations of forms (all those 1s and 0s)- is never having the meaning to which the form has been suited» (Fauconnier, Turner, 2002, p.5).

Éste es precisamente el punto de vista que he intentado mostrar a lo largo de estos artículos: la promesa de la Web Semántica de añadir significado a la información no nos debería hacer perder de vista el hecho que, como exponen Fauconnier y Turner, el significado no se encuentra en las formalizaciones propuestas por las ontologías.

No mantengo una crítica a priori sobre la utilidad de las ontologías en la organización y la recuperación de la información, mediante la postulación de unas misteriosas capacidades cognitivas inaccesibles al estudio crítico. Más bien, mi creencia es que sólo un conocimiento más profundo de estos procesos cognitivos puede mejorar sustancialmente la calidad de los sistemas de organización y recuperación de la información que los bibliotecarios-documentalistas podemos ofrecer a nuestros usuarios.

Así, me gustaría que estos artículos fuesen entendidos como una invitación a la comunidad de bibliotecarios-documentalistas al estudio de estas capacidades, tan presentes en nuestra vida diaria que pasan desapercibidas. Y, con esta finalidad, concluiré adoptando un aforismo del filósofo Ludwig Wittgenstein:

«[…] Venga, pregúntatelo: ¿qué es lo que sabes, de estas cosas? […]» (Wittgenstein, 1997, p. 142).

Bibliografía

Barsalou, LW. Ad hoc categories [en línea]. En: Hogan, P.C. (Ed.). The Cambridge encyclopedia of the language sciences. New York: Cambridge University Press. En prensa. http://www.psychology.emory.edu/cognition/barsalou/papers/Barsalou_entry… [consulta: 24 Enero 2011].

Davies, Clare. Finding and knowing : psychology, information and computers. London; Routledge, cop. 2005. XI, 327 p. ISBN 0851424546.

Fauconnier, Gilles; Turner, Mark. The way we think: conceptual blending and the mind hidden complexities. New York; Basic Books, 2002. 464 p. ISBN: 0465087868.

Reeves, Lauretta M.; Hirsh-Pasek, Kathy; Golinkoff, Roberta. Palabras y significado: de los elementos simples a la organización compleja. En: Gleason, Jean Berko; Ratner, Nan Berstein (eds.). Psicolingüística. 2ª ed. Madrid: McGraw-Hill, D.L. 2001. p. 169-245.

Wittgenstein, Ludwig. Investigacions filosòfiques. Traducció i edició a cura de Josep M. Terricabras. Barcelona; Edicions 62, 1997. 394 p. ISBN 8429742891.

Evelio Martínez Cañadas

Bibliotecario en Biblioteques de Barcelona. Me interesan (sin ningún orden en particular): bibliotecas públicas, content curation, ciencia y racionalidad, psicología de la información, lectura, sociedad de la información,... y unas cuantas cosas más.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *