De manuscritos a algoritmos: la labor humanística en la Inteligencia Artificial

Aquí me pongo a cantar

al compás de la vigüela,

que el hombre que lo desvela

una pena estraordinaria,

como la ave solitaria

con el cantar se consuela

 

El texto que acabas de leer pertenece al inicio del Martín Fierro, un poema narrativo de 1872; cuando lo leí tuve claro que mi futuro sería investigar la figura de los gauchos e impartir clases sobre literatura hispanoamericana. No me acerqué ni un poquito.

Estudié Filología Hispánica en la US, me tomó más tiempo del que tenía previsto: dejé la carrera un par de veces por motivos personales, y al retomarla me di cuenta de que tenía que apostar por algo que me asegurara un trabajo al terminar (y cuanto antes). Normalmente, cuando entras en Filología la salida que todos tenemos en mente es la de ser profesor de lengua y literatura o, en su defecto, profesor de español como lengua extranjera.

Yo tuve la suerte de dar con mi grandísimo profesor y actual compañero de proyectos: Juan Pablo Mora. Sus clases, que me parecieron las más caóticas del mundo, nos daban la libertad de crear proyectos por nuestra cuenta. Él fue quien me habló de la Lingüística Computacional y desde entonces, en mis ratos libres, fui leyendo sobre el tema. Juan Pablo hizo que viera la lingüística con otros ojos y se convirtió en mi tutor del Trabajo Final de Grado sobre estrategias de manipulación lingüísticas. Cuando terminé el TFG pensé en la idea de automatizar esos procesos y poder detectar esas estrategias de manipulación a través de las redes sociales. Resulta que ya existía y que se llevaba haciendo desde hacía muchísimo tiempo. Fue justamente ahí cuando decidí matricularme en el máster de Ciencias del lenguaje de la UNED y aplicarlo a la vía de lingüística computacional. 

El verano que terminé el máster, recibí un mensaje de David Munárriz, Director de estrategia y soluciones de Emergya. Quería entrevistarme para que me uniera a la empresa. Recuerdo algo que me dijo que me ha acompañado hasta ahora: “No sé en qué, pero sé que puedes sernos de ayuda”. Cada vez que me enfrento a algo nuevo últimamente, siento que me vuelvo muy pequeñita, pero entonces me agarro a eso: “vale, de momento no tengo claro el cómo ni el qué, pero seguro que encontraré la manera de aportar lo que sé en este nuevo reto”. 

En la actualidad, trabajo en el área de lingüística de Emergya desarrollando asistentes virtuales y proyectos basados en Procesamiento del Lenguaje Natural (NLP)

En lo que respecta a los asistentes, en nuestro día a día las lingüistas trabajamos en el desarrollo cognitivo del asistente; ¿suena complejo? Quizá así se entienda un poco mejor:

  • Implementamos, acorde a la personalidad del asistente, los rasgos variacionales (según su posición social, su edad, etc); luego, esas respuestas las trasladamos a Dialogflow teniendo en cuenta las variables que se puedan dar dentro de la propia conversación.
  • Ayudamos a definir los flujos conversacionales: intenciones, dependencias... y lo validamos con el departamento de arquitectura.
  • Creamos los conjuntos de entrenamiento para que nuestro asistente pueda comprendernos. Estos conjuntos de entrenamiento son una parte vital de nuestro trabajo, puesto que tenemos que definir bien la lógica sintáctica y semántica que vamos a utilizar en cada intención que queramos capturar.

Esto es solo un pequeño ejemplo de lo que hacemos, pero la verdad es que en nuestro día a día estamos involucrados en otros procesos que requieren de nuestro trabajo; como la extracción de datos, análisis y creación de modelos de entrenamiento en NLP que llevamos a cabo mediante la lingüística de corpus. 

María Fernández lingüista Emergya

Y no es un trabajo aislado: nuestros equipos son multidisciplinares, con profesionales de diseño conversacional, desarrollo y arquitectura. De manera conjunta, buscamos la solución a los retos que nos vamos encontrando, compartiendo y comprendiendo cada punto de vista. Por eso la comunicación y la sinergia entre compañer@s es vital.

A parte de esto, ahora mismo estoy en un proyecto de investigación de la US sobre los sesgos que se transmiten a través del Procesamiento de Lenguaje Natural. Al generalizar determinados patrones, vemos cómo se ejerce un trasvase de esos sesgos que realizamos en nuestros discursos a los que se generan de manera automática por IA. Es un proyecto sumamente interesante, y me siento muy afortunada de estar ahí aprendiendo junto a grandísimos profesionales.

También en diciembre comenzamos un curso de aprendizaje cooperativo de NLP para profesores y alumnos internos de la US. Este proyecto es, de nuevo, una colaboración con el departamento de Lingüística de la US y @Lingunaria, una iniciativa personal que recién comienza a andar este mes. 

En enero 2021 y de la mano de Emergya, el departamento de Lingüística de la US y otros compañeros del proyecto de Sesgos e IA,  comenzamos el proyecto: “Jóvenes con investigadores”, unas jornadas mensuales para acercar nuestro trabajo a alumnas y alumnos de institutos de la provincia. En este caso, el proyecto que compartiremos será también sobre sesgos en NLP y su impacto en la IA. Ya tenemos esbozado el calendario de actividades, y hay algunas muy interesantes, como aprender a usar algunas herramientas para el tratamiento de corpus lingüístico e identificar los patrones segregativos que se dan en los discursos actuales en Twitter o Twitch

Como verás, ser lingüista a día de hoy da para mucho: desde colaborar en equipos transversales en el desarrollo de un asistente virtual, a analizar y predecir comportamientos en RRSS, pasando por intentar ‘mejorar’ cognitivamente a la Inteligencia Artificial en ámbitos tan complejos como la elaboración de nuestros mensajes y el impacto de los mismos. Es una carrera que, gracias a los avances tecnológicos (algo que a priori puede parecer paradójico), está muy de moda, porque en un mundo donde la automatización marca el día a día, la labor humanística es más necesaria que nunca.

María Fernández
Lingüista computacional

¿Quieres transformar tu empresa con tecnologías de futuro?

fondo-footer
base pixel px
Convert
Enter PX px
or
Enter EM em
Result