El análisis de sentimiento de texto en las redes sociales - BiblogTecarios

El análisis de sentimiento de texto en las redes sociales

brain-954816_640Dada la ingente cantidad de comentarios, emociones, opiniones, gustos y valoraciones que se manifiestan diariamente a través de diversos canales (blogs, microblogs, foros, Facebook, LinkedIn, etc.) resulta muy útil poder extraer de forma automática el sentimiento predominante asociado a una marca, empresa o producto, principalmente para planificar su potenciación si es positivo o cómo contrarrestarlo si es negativo. Por ello se monitoriza Internet utilizando herramientas online pues esta información es espontánea y poco estructurada y se diferencia en su inmediatez de la obtenida a través de encuestas y estudios de mercado.

El análisis de sentimiento de textos en las redes sociales (que adopta diferentes nombres en inglés como sentiment analysis, opinion mining, brand monitoring, buzz monitoring, online anthropology, market influence analytics, conversation mining, online consumer intelligence, user generated content) es el proceso que determina el tono emocional que hay detrás de una palabras determinadas, si una frase contiene una opinión positiva o negativa sobre un producto, marca, institución, organización, empresa, evento o persona.

El objetivo primordial es extraer aquellos términos semánticos que expresen un sentimiento en particular para conocer la opinión, las actitudes y las expectativas sobre un tema en concreto así como para analizar el comportamiento de los usuarios ante algún mensaje y, por tanto, determinar su impacto o poder anticipar su reacción. Los sentimientos se clasifican en positivos, negativos o neutros. Sin embargo, el lenguaje natural es complejo y ambiguo por lo que enseñar a una máquina a que analice los diferentes matices gramaticales, variaciones culturales, jergas, expresiones coloquiales o a distinguir faltas de ortografía, la sinonimia o la polisemia dentro de un contexto que determina el tono de la conversación es francamente difícil. Así, por ejemplo, ante un comentario sarcástico, la máquina tomaría la frase como algo positivo en vez de algo negativo o expresiones como “LOL, OMG, estuvo geeeeeeeniaaaaaaaal” son dificilísimas de procesar.

Esta es la razón por la que el proceso automático es propenso a errores y requiere una revisión manual posterior. De este modo se complementan la rapidez de los sistemas expertos con listas de palabras buenas y malas hechas manualmente con sistemas de procesamiento del lenguaje natural y el entendimiento del habla en los que se emplean modelos estadísticos y sets de entrenamiento.

En el diseño de los sistemas se combinan distintas áreas como son las técnicas de minería de datos, la selección de atributos y los algoritmos de árboles de decisión. El procesamiento del lenguaje natural (PLN) transforma el texto en un lenguaje que la máquina pueda entender, el Big Data recaba gran cantidad de datos para obtener un análisis más preciso al mejorar el desempeño de los algoritmos y la Inteligencia Artificial (IA) utiliza la información que le proporciona el PLN para determinar las categorías de sentimientos y sus correspondientes polaridades: satisfacción-insatisfacción, confianza-temor, amor-odio, felicidad-tristeza.

En primer lugar se eliminan todos aquellos elementos que se consideran “ruido” como son los símbolos, las abreviaciones coloquiales, las palabras vacías, etcétera. Después se contrastan las palabras restantes con una base de datos para etiquetarlas y asignarles sentimientos. El mantenimiento de estos diccionarios es costoso y suelen tener baja cobertura, además su mantenimiento lo suelen realizar los lingüistas que lo han desarrollado y no sus usuarios. Por ello la tendencia es utilizar aplicaciones basadas en aprendizaje automático, aunque no tengan datos etiquetados. Esta limitación se puede solventar entrenando al sistema pero requiere una alta implicación por parte del usuario, que no siempre está interesado o dispone del suficiente tiempo.

Las aplicaciones que monitorizan los medios sociales se dividen en dos tipos: aquellas que se centran principalmente en la red de usuarios y las que se enfocan hacia el contenido de los mensajes:

  • Red de usuarios: facilitan análisis con métricas de la presencia de una determinada marca, sus competidores, los usuarios más influyentes y los mensajes más difundidos.
  • Contenido de los mensajes: proporcionan un análisis con polaridad (positivo o negativo) de la opinión, clasificación por categorías temáticas y la detección de palabras clave.

En ambos casos las herramientas posibilitan la elaboración de presentaciones gráficas con los resultados en forma de paneles de control o informes. Además, algunas de ellas permiten diseñar sistemas de alerta para detectar las denominadas crisis de marca o la parametrización de las búsquedas para que se adapten a las necesidades que vayan surgiendo o la introducción de filtros para refinar los resultados.

El análisis de contenido de las redes sociales depende principalmente de la cobertura (el número de menciones y la amplitud y rango de los canales monitorizados) como la precisión o acierto ya sea mediante el establecimiento de una polarización, como de una clasificación temática o de la detección de palabras clave.

No obstante, los sistemas futuros tienden no sólo a valorar la opinión vertida como positiva, negativa o neutra sino también por la detección de tendencias y de temas haciendo más ricas las nubes de palabras, agrupando términos y relacionándolos con personas y entidades, de tal manera que se descubra el significado oculto a través de interrelaciones conceptuales. Además persiguen afinar las valoraciones para eliminar los mensajes irrelevantes y, sobre todo, los errores de interpretación.

 

The following two tabs change content below.

Inma Herrero

En este rincón encontrarás todo lo que me llama la atención como, por ejemplo, el desarrollo de la creatividad, la estrategia y planificación, la gestión empresarial, la gestión de contenidos, la vigilancia tecnológica, la inteligencia competitiva y las redes sociales.

Latest posts by Inma Herrero (see all)

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos necesarios están marcados *