Eventos & Webinar, Noticias

El CogitoLAB de Madrid presentó en la ACL un estudio para identificar de forma automática los bots en Twitter

La investigación se centra en entender la particularidad del lenguaje que se genera en las RRSS

El equipo del CogitoLab de Expert System en Madrid participó en la 57 edición de la ACL, la conferencia anual que organiza la Association for Computational Linguistics, que se celebró en Florencia entre el 28 de julio y el 2 de agosto. En el encuentro Andrés Garcia-Silva, Cristian Berrio y José Manuel Gómez-Pérez presentaron un estudio empírico sobre incrustaciones pre-entrenadas y modelos de lenguaje para la detección de bots. La investigación está centrada en la comprensión de la particularidad de los mensajes que a menudo se generan en las redes sociales.

El ajuste de los modelos de lenguaje previamente entrenados ha avanzado significativamente. Por lo general, estos modelos de lenguaje se aprenden a partir de corpus de texto grandes y bien estructurados procedentes de enciclopedias, libros o noticias. Sin embargo, una importante cantidad del texto que se analiza procede de  datos web o de las redes sociales. El estudio responde a la pregunta ¿Cómo se generalizan y capturan los modelos de lenguaje pre-entrenados estándar con las peculiaridades de un texto bastante corto, informal y frecuentemente generado automáticamente que se encuentra en las redes sociales? Para responder a esta cuestión, la investigación se enfocó a la detección de bots en Twitter, como tarea de evaluación para probar el rendimiento de enfoques de ajuste basado en modelos de lenguaje contra arquitecturas neuronales populares como LSTM y CNN, combinadas con incrustaciones pre-entrenadas y contextualizadas. Los resultados obtenidos muestran fuertes variaciones de rendimiento entre los diferentes enfoques del modelo de lenguaje, lo que determina que hay que seguir profundizando en la investigación.


Share On

Menú