El documentalista está desnudo - BiblogTecarios

El documentalista está desnudo

Pensador de RodinComo en el relato clásico de “El traje del emperador”, me temo que actualmente hay una serie de asunciones en el mundo de la documentación que quizá da cierto pudor citar o discutir, pero sin embargo considero que deben discutirse. Desde luego, tal como se comentaba en el reciente artículo de Laura Novelle y antes en el de Carlos Giraldez, la percepción es que la formación no está correctamente orientada y consecuentemente, mal puede estar orientada luego la profesión si no lo está la formación previa. Pero, en cualquier caso, en la actualidad la formación es continua, por lo que siempre puede aprenderse nuevos herramientas y técnicas. El problema es ¿cuáles?

Hay axiomas como, “la profesión de Community Manager como “evolución profesional” del documentalista”, “Bigdata como dominio de conocimiento para los documentalista”, “La gestión de contenidos como ámbito de la documentación”, que considero muy discutibles, por no decir erróneos en muchos casos, cuando se olvida continuamente otros elementos que Sí son intrínsecamente propios de la documentación, como podrían ser los gestores documentales, la clasificación y catalogación automática o las herramientas de gestión de expedientes (Case Management).

En algún caso he oído citar, respecto a alguno de los elementos antes citados, que entran en el ámbito del documentalista porque “son información”, pero en la “sociedad de la información”, casi todo es información. Hasta existen hornos que tienen ya incorporada una lista de recetas que presentan en pantalla…

Entremos en la cacharrería cual elefantes…

Community Manager (CM)

Según su definición, Community ManagerEs un puesto de trabajo dentro de la mercadotecnia en medios sociales”, y básicamente sus funciones son:

  • Gestionar la marca en Internet.
  • Monitorización de la competencia.
  • Escucha activa y conservación en las redes sociales.
  • Creación del contenido para la Web y blog.
  • Actualización diarias en las redes sociales en las que la empresa esté presente.
  • Control y análisis del posicionamiento online.”

Estamos hablando de una “combinación de marketing y relaciones públicas”. No se trata de manejar documentación sino difundir una marca y sus productos (refrescos, vehículos, operadoras de telefonía,..) y atender consultas, quejas e imagen en redes sociales. Lo más cercano a la documentación es la parte de posicionamiento y SEO, en cuanto a manejo de la información, descripción.., pero dado que viene determinado por la estructura y herramientas de portales y gestión de contenidos de la entidad (que viene determinado por los equipos de marketing y tecnología), el margen no es demasiado elevado en cuanto a optimización. En cuanto a la “gestión de los contenidos”, se desarrolla más adelante.

Podría alegarse que en una biblioteca o archivo se atiende a usuarios y se reciben peticiones, pero eso es igualmente cierto para una panadería o un bar.

Otra cosa muy diferente es si hablamos de ser C.M. de una institución o empresas dentro del ámbito de la documentación (Biblioteca Nacional, empresas de desarrollo de productos de bibliotecas, archivos o centros de documentación…) de lo cual tenemos algunos buenos ejemplos (Julián Marquina) de cómo un profundo conocimiento de la materia permite difundir, relacionarse y hacer una buena labor de C.M. En ese caso evidentemente debe conocerse perfectamente el mundo de la documentación, pero lo mismo ocurre si se deseas vender productos para el mundo de la documentación (para hacer una demostración ADECUADA de un SIGB debe conocerse cómo funcionan y las necesidades de una biblioteca). Pero eso no implica igualmente que “la salida natural de los documentalistas sea la de vendedor (en general)”.

Por tanto no parece que C.M. (en general) sea “la salida natural de un documentalista”, sí parece que trabajar en una entidad (pública o privada) del ámbito de la documentación (como vendedor, C.M. o Director) sea razonable, al igual que conocer nuevas habilidades profesionales (C.M., Modelado de datos, SKOS, etc.) dentro de la misma profesión. Adicionalmente, si no hay recursos para aumentar la plantilla de bibliotecarios o para la compra de fondos, ¿los hay para incluir un C.M. en una biblioteca?

Bigdata

Según su definición, Big Data hace referencia a enormes conjuntos de datos que suelen caracterizarse por las llamadas 3V (Volumen, Variabilidad, Velocidad) que condicionan las tecnologías, herramientas y enfoques a utilizar. El “Volumen” implica que se maneja conjuntos de datos de Petabytes, lo que hace imposible manejarlos con una BBDD estándar (aunque el modelo de datos sea totalmente Relacional) ya que los tiempos de respuesta y requerimientos de memoria lo hacen inutilizable aunque pudiera ser posible. La “Variabilidad” implica que aunque hablemos de una Base de Datos, no son Modelos Normalizados, es decir no hay un conjunto de elementos todos iguales e interrelacionados con relaciones de integridad, se trata de conjuntos muy variables de información ESTRUCTURADA. Por último, la “Velocidad” implica un volumen de generación de datos tan alto que la ingestión no puede hacerse con medios o herramientas convencionales.

Un ejemplo claro es la lectura de datos por un coche autónomo. Un coche autónomo debe leer información sobre su posición, velocidad, contorno, estado mecánico, posición, velocidad y aceleración de otros vehículos, peatones, ruta, obstáculos, etc. El volumen de información que se maneja es enorme y debe leerse cada segundo, es muy variable (datos de movimiento, datos geométricos, térmicos, etc.) y la velocidad de generación es muy grande, por lo que debe almacenarse y procesarse según se genera, sin “atragantarse”.

Estamos por tanto ante BBDD que, aunque no sigan el estándar SQL sino que son NoSQL, son BBDD con una estructura dada (sean basadas en grafos, clave-valor, orientadas a objetos, tabulares, etc.) y además con una componente tecnológica muy importante (por su volumen y velocidad de ingestión) y con un modelado de sus elementos que aunque variable, está modelado, salvando las distancias, como puede estar modelado en una BBDD relacional. Aunque dentro de las BBDD NoSQL hay algunas que se llaman “documentales”, no tiene nada que ver con la documentación sino que se refieren a la forma de modelar.

Además hay que tener en cuenta otro factor, que es el número de casos en que puede aplicarse. Como su nombre indica, es Big, y realmente es muy grande. A pesar del furor despertado, donde parece que “hasta la tienda de comestibles de la esquina tendrá Bigdata”, es aplicable en casos particulares. Una institución o empresa pequeña raramente tendrá un volumen de información que justifique el uso de Bigdata. Incluso las grandes, dependiendo de su actividad, tampoco lo tendrán. Hay que tener en cuenta que, según todos los especialistas recuerdan, si el volumen, variabilidad o velocidad no son muy grandes, es mucho más sencillo y barato el uso de BBDD convencionales (que pueden ser SQL o noSQL, pero NO BigData).

Al igual que otros temas del ámbito de las BBDD, como la administración de BBDD, los Datamart o el Datawarehouse, que no han sido propias del ámbito de los documentalistas, ¿tiene sentido que BigData sea un área de actuación de los documentalistas, cuando además no está claro que realmente llegue a aplicarse de forma tan generalizada como parece?

Gestión de contenidos

Según su definición, “El gestor de contenido es una aplicación informática usada para crear, editar, gestionar y publicar contenido digital multimedia en diversos formatos. El gestor de contenidos genera páginas web dinámicas interactuando con el servidor web para generar la página web bajo petición del usuario, con el formato predefinido y el contenido extraído de la base de datos del servidor”.

Es decir, es una herramienta para presentar contenido multimedia. Esos contenidos podrían ser, por ejemplo, una colección de fotografías y documentos de Europeana, pero también podría ser el catálogo de productos de una gran superficie, de un fabricante de ropa o de un fabricante de móviles. En el primer caso, evidentemente la estructuración, definición de metadatos y entrada de documentos si requieren un especialista en documentación, sin embargo, la introducción y gestión del catálogo de un fabricante (no la gestión interna de sus documentos sino la web pública, donde el factor predominante es la publicidad y las ofertas), ¿requiere un documentalista?

Como en el caso de CM, el cuidado del SEO sí requiere conocimientos especializados, pero viene determinado por la Web de la entidad en general. Por tanto, al igual que en el caso del Community Manager, dependiendo del uso tendría sentido su aplicación dentro de la Documentación, o más bien dentro del Marketing. Pero desde luego, la “gestión de contenidos” como tal no es automáticamente un ámbito de trabajo del documentalista. La gestión de contenidos de una entidad dentro del ámbito de la documentación sí lo sería.

Veamos ahora otras alternativas bastante descuidadas.

Gestores Documentales

Todas las empresas e instituciones necesitan manejar documentos, deseablemente en formato digital (ya sean documentos originariamente en papel digitalizados o documentos ofimáticos  creado de forma digital) para lo que se requiere un gestor documental, no un producto de Colaboración (la mayor parte de los cuales, aunque cubren adecuadamente aspectos como mensajería, Wikis, blog, calendarios, etc. tiene graves carencias en cuanto al manejo de documentos, seguridad y metadatos) ni un gestor de contenidos. En cuanto a una herramienta de repositorio digital, solo valdrá para algunos casos muy puntuales. Para la gran mayoría de los casos, hace falta un gestor documental completo que pueda manejar todos los documentos, expedientes, seguridad. Eso implica que todas las instituciones públicas (ministerios, comunidades, ayuntamientos, etc.), empresas y autónomos potencialmente pueden/deben tener un gestor documental (o los servicios de uno remoto en nube o equivalente) para guardar documentación, facturas, contratos, nóminas, etc. Estoy hablando de los documentos vivos, no de un archivo en el que se almacenan los documentos cuando los expedientes ya no se utilizan (ese escenario difícilmente puede justificar su coste, y tiene una utilidad limitada).

Es decir, hablamos de, según datos del INE, unos 3.200.000 empresas y unos 3.100.000 autónomos frente a menos de 6.800 bibliotecas según el INE, es decir 1.000 veces más instalaciones potenciales. Y con la complejidad añadida de que cada empresa o sector son diferentes, tiene unos tipos de expedientes, tipos documentales, normativas de aplicación y flujos de trabajo distintos, lo que implica que, aunque se apoye en normativas y recomendaciones, debe realizarse un análisis y estudio específico, definiendo tipologías de documentos y expedientes, metadatos a utilizar, seguridad, etc.. Por tanto no solo hay 1000 veces más lugares que podrían requerir documentalistas (al menos para una definición), sino que son proyectos más complejos y en una institución mediana o grande puede ser realmente múltiples proyectos, ya que la estructura de información y circuitos del departamento de compras será muy diferente a la asesoría jurídica, producción o I+D. (Ha que destacar que últimamente está prestándose cierta atención a la gestión de documentos en el ámbito de la Salud, algo que es un buen cambio, aunque insuficiente).

Y en este escenario ¿qué porcentaje de las asignaturas de las carreras, ofertas de cursos, master o mensajes en foros y listas de distribución tratan específicamente sobre gestores documentales?

Clasificación y catalogación automática

Este es un divorcio que he comentado en otras ocasiones. El tratamiento de expedientes y documentos en casos como siniestros de automóvil, aperturas de cuentas bancarias, hipotecas, gestión de facturas, encuestas, etc. están automatizadas en gran parte de las entidades y empresas.

Y por automatizadas debe entenderse que tras digitalizar o importar por ejemplo 100 páginas (sin separación o manipulación previa), un sistema previamente entrenado analiza y decide que esas páginas son dos expedientes de tipos A y B, separa las páginas en documentos (“grapando” virtualmente las páginas), analiza los documentos (que no tiene por qué ser formularios, pudiendo ser cartas, documentos notariales, etc.) y clasifica los mismos y extrae los metadatos que se ha definido deben componer el conjunto diferente de metadatos de cada tipo. El porcentaje de éxito en el tratamiento automático puede ser muy variable dependiendo del proyecto y tipo de documento, pero puede alcanzarse de un 80% a un 90% de automatismo. Los documentos que no puedan ser clasificados pasarían a tratamiento manual. Además puede haberse definido qué documentos deben componer el expediente (si su estructura es fija) y levantar una alarma si falta alguno.

Si contamos por ejemplo el número de hipotecas firmadas en un año (contando más de 20.000 al mes en pasados meses según el INE) eso nos da unas 250.000 hipotecas año y con más de 10 documentos por expediente, indica una clasificación automática de 2.500.000 documentos/año. Hay múltiples escenarios en entidades públicas y empresas privadas en el que la clasificación y asignación de metadatos es automática, y cada vez el número es mayor.

El trabajo de analizar un expediente, separar documentos, clasificarlos y extraer metadatos de ellos lo están haciendo ya programas de ordenador. Y los profesionales cuyo trabajo se ve sustituido por estos sistemas ¿Se están formando en el entrenamiento y uso de estos sistemas cuando podrían ser los más adecuados para enseñar a un sistema automático a hacer su trabajo?

¿Qué porcentaje de las asignaturas de las carreras, ofertas de cursos, master o mensajes en foros y listas de distribución tratan específicamente sobre sistemas de clasificación automática avanzada?

Gestión de expedientes

En estos últimos años han surgido un nuevo tipo de programas, las herramientas de “Case Management”, que apoyados en (complementando a) gestores documentales permiten la definición de circuitos de tratamiento de expedientes, y lógicamente sus documentos correspondientes, entendiendo además documentos en un sentido “amplio”, de forma que toda la comunicación (correos, voz, etc.) con el “cliente” se centralice y unifique. Estos sistemas, que trataré en un post posterior con más detalle, han surgido como forma de superar las herramientas de BPM en muchos casos disponibles como extensión del gestor documental, y en otros casos disponibles de forma totalmente independiente, que aunque potentes exigían unos circuitos y procesos muy definidos y rígidos. Algo que no siempre es posible diseñar o, aunque posible, muy costoso en tiempo.
Este parece otro ámbito de interés para el mundo de la documentación, ya que hablamos de herramientas centradas en expedientes (con su estructura y definición) y que lógicamente están soportados en documentos (en diversos formatos y soportes).

La conclusión podría ser: ¿por qué buscar nuevas actividades profesionales poco o nada relacionadas con la documentación cuando hay un gran número de herramientas/actividades claramente dentro del ámbito de la documentación a las que no se atiende lo suficiente?

El debate, que siempre es enriquecedor, está servido (espero).

The following two tabs change content below.

Joaquín Hierro

Tras muchos años trabajando en software de gestión documental de diverso tipo, actualmente defino estrategia y elijo productos de gestión documental para una multinacional española. Mi colaboración en Biblogtecarios se orienta a analizar y difundir tecnologías y soluciones disponibles para un documentalista del siglo XXI.

Latest posts by Joaquín Hierro (see all)

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos necesarios están marcados *