Eneko Agirre: hitzen esanahiak mapa gisa // Significados de palabras vistos como mapas (Elhuyar, 2017-03-01)

[EU]
Eneko Agirre Bengoa gure irakasleari elkarrizketa bat egin diote Elhuyar aldizkarian: “Makinak pertsonei ulertzeko gai badira, aurrerapauso handi bat egin dugu. Gure mundura datoz makinak.”  Hona hemen pasarte batzuk:

  • Google Research saria jaso zenuen duela urtebete. Zer eman dizu sari horrek?
    Batez ere, egindako lanaren aitortza. Gure ikerketak interesa piztu duen seinale da, eta horrek ikertzen jarraitzera animatzen gaitu. Eta sariak diru apur bat ere ematen du, pertsona bat kontratatzeko adina.
  • Makinek gizakion hizkuntza uler dezaten ikertzen duzu. Hain zaila al da, bada, gu ulertzea?
    Itzultzaile automatikoak erabiltzen ditugunean, askotan konturatzen gara zein gaizki ulertu duten. Adibidez, “Trenes mañana y tarde” itzultzeko garaian, “Trenak goiz eta arratsaldez” itzuli beharrean, “Trenak bihar eta berandu” egin dezake. Zergatik? Askotan izaten da ez duelako ulertu zertaz ari garen. Badaude hitz batzuk esanahi bat baino gehiago izan ditzaketenak, eta makinak ez daki kasu horretan zein aukeratu.

    Berez, nire ikerketa-lerroa hori da, hizkuntzaren prozesamendua, eta, horren barruan, semantika edo esanahiarekin zerikusia du, semantika konputazionalarekin. Horretarako, hitzen esanahiak espazio batean irudikatzen ditugu, mapa batean bezala. Hizkuntza desberdinetako hitzak jartzen ditugu; gure kasuan, ingelesa, euskara eta gaztelania, eta, mapa horretan, haien esanahiei dagozkien puntuak ditugu markatuak. Adibidez, hitz bat dugu: “banco”, “aurrezki-kutxa” esanahia duena maparen puntu batean, baina badugu “aulki” esanahia duena ere, beste puntu batean. Berdin “mañana” hitza, “goiza” zein “bihar” izan daitekeena. Guk mapa hori ondo egiten badugu, gero, makina testu bat ulertzen hasten denean, kokatu ahal izango du ea “banco” hori esertzekoa ala dirua ateratzekoa ote den. […]
  • Egia al da hizkuntzaren prozesamenduaren teknologia ari dela gaur egun informazioaren gizartearen aurrerapena baldintzatzen?
    Egia esan, bada erronka nagusietako bat. Askotan, industriak duen interesagatik nabaritzen da hori, eta, gaur egun, softwarearen erraldoi guztiak —Microsoft, Google, Facebook, IBM— buru-belarri ari dira lanean hizkuntzaren prozesamenduan. Nik uste hurrengo aurrerapauso handi bat hemendik etorriko dela. Beste erronka handi bat ere badago: irudiak ulertzea. […]

[ES]
La revista Elhuyar acaba de publicar en su último número una entrevista con nuestro profesor Eneko Agirre Bengoa titulado:  Si las máquinas son capaces de entendernos, hemos dado un gran paso adelante.  Estos son algunos de los temas tratados:

  • Hace un año recibiste el premio Google Research.
    ¿Qué te ha aportado este premio?
    Sobre todo reconocimiento del trabajo realizado. Señal de que nuestras investigaciones han despertado interés. y eso nos anima a seguir investigando. Y con la cantidad asignada al premio hemos podido contratar un investigador. […]
  • Investigas para que las máquinas entiendan el lenguaje humano. ¿Es tan difícil que nos entiendan?
    El objetivo de esta investigación básica es la representación del significado de las palabras, es decir, saber cuándo los significados de dos palabras están relacionados en un idioma o en idiomas distintos. Sería como tener un diccionario y saber qué palabras tienen significados similares y cuáles no. Por ejemplo, saber que el significado de la palabra banco es similar a caja de ahorros y silla, dependiendo de su significado, pero no así a palabras como gato. Nosotros realizamos, en definitiva, la representación de los distintos significados de una palabra, pudiendo distinguir que un sentido de banco se parece al de caja de ahorros y el otro a silla, pero no viceversa. Nuestra propuesta además, es capaz de representar los significados de palabras de varios idiomas en un único espacio, con lo que también sabremos que un sentido de banco es similar a bank y kutxa en inglés y euskara, respectivamente, y el otro sentido de banco a chair y aulki, pero ninguno de los dos significados son similares a katu ni cat. […]
  • ¿Es verdad que la tecnología de procesamiento del lenguaje hoy en día está condicionando el avance en temas de la sociedad de la información?
    Sí, a decir verdad, éste es uno de los princpales desafíos. Eso es fácil de constatar visto el interés mostrado por la industria. Hoy en día los gigantes del software —Microsoft, Google, Facebook, IBM— están trabajando con ahinco en procesamiento del lenguaje. Creo que un próximo paso adelante significativo vendrá por esta línea. Otro desafío muy importante es la interpretación de imágenes […]

Iruzkin bat honentzako: Eneko Agirre: hitzen esanahiak mapa gisa // Significados de palabras vistos como mapas (Elhuyar, 2017-03-01)

Erantzuna idatzi

 

 

 

HTML etiketa hauek erabil ditzakezu

<a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>