Google Research premia al profesor Eneko Agirre

Le concede una ayuda económica de 50.000 dólares para su investigación sobre la representación del significado interlingüe de palabras y conceptos

  • Noticias

Fecha de primera publicación: 17/03/2016

Eneko Agirre, profesor del Departamento de Lenguajes y Sistemas Informáticos de la Facultad de Informática de la UPV/EHU y miembro del grupo de investigación IXA Taldea, ha recibido uno de los premios de investigación de Google -Google Research Awards- que se conceden anualmente. El profesor Agirre ha contado en su estudio con la colaboración del profesor Aitor Soroa, el investigador Oier López de la Calle, y el alumno de doctorado Josu Goikoetxea.

En el ámbito del procesamiento del lenguaje Google ha concedido 10 premios. Además del profesor Agirre, han sido premiados también investigadores de universidades como Harvard, Berkeley, Edimburgo o Washington. En conjunto, Google ha premiado 151 propuestas (entre 950 candidatas de 18 áreas del ámbito de la informática), enviadas por 350 universidades de 55 países. El profesor Eneko Agirre recibirá 50.000 dólares para su investigación ‘Learning Interlingual Representations of Words and Concepts', centrada en el estudio del significado interlingüe de las palabras y los conceptos on-line.

Actualmente el problema de las traducciones automáticas o los motores de búsqueda en la red está en la literalidad de las palabras, es decir, la aplicación traduce o busca la palabra de forma literal, sin prestar atención al significado de la misma. Sin embargo, esta situación puede mejorar de forma considerable gracias al trabajo premiado por Google.

"El objetivo de esta investigación básica-explica Eneko Agirre- es la representación del significado de las palabras, es decir, saber cuándo los significados de dos palabras están relacionados en un idioma o en idiomas distintos. Sería como tener un diccionario y saber qué palabras tienen significados similares y cuáles no. Por ejemplo, saber que el significado de la palabra banco es similar a caja de ahorros y silla, dependiendo de su significado, pero no así a palabras como lunes o gato. Nosotros realizamos, en definitiva, la representación de los distintos significados de una palabra, pudiendo distinguir que un sentido de banco se parece al de caja de ahorros y el otro a silla, pero no viceversa. Nuestra propuesta además, es capaz de representar los significados de palabras de varios idiomas en un único espacio, con lo que también sabremos que un sentido de banco es similar a bank y kutxa en inglés y euskara, respectivamente, y el otro sentido de banco a chair y aulki, pero ninguno de los dos significados son similares a astelehen, Monday, katu ni cat" (ver imagen galería).

El proceso se basa en aprender dicha representación a partir de grandes cantidades de documentos, utilizando métodos matemáticos de la inteligencia artificial. Una vez aprendida la representación el sistema mira en su base de datos con qué otras palabras tiene similitud la palabra que buscamos o queremos traducir. Y, en base a su significado, muestra los documentos que la contenga, aunque no sea la palabra exacta que se haya escrito.

Otro de los avances de este método es su posible aplicación en cualquier idioma, aunque la investigación se centra en tres: castellano, euskera e inglés. "La aplicación informática que utilizamos es totalmente automática y ello hace que pueda aprender representaciones para cualquier idioma que se use".

Los métodos que soportan este tipo de métodos son la base del curso que Eneko Agirre imparte en el Máster "Language Analysis and Processing" en la Facultad de Informática del la UPV/EHU en Donostia.

Enlaces:

Foto: Gorka Estrada. UPV/EHU