Hizketa-keinu espontaneoagoak lortu dituzte UPV/EHUko robot humanoide batean

Robotika sozialean aurrera egiteko, robot batek hitz egitean mugimendu espontaneo eta naturalagoak egitea lortu dute GAN sareak erabiliz

  • Ikerketa

Lehenengo argitaratze data: 2019/04/10

Igor Rodríguez. Argazkia: UPV/EHU

Robot sozialek hitz egitean gorputz-hizkuntza naturala izan dezaten, hurbilketa bat egin dute UPV/EHUko RSAIT ikerketa-taldean. Mugimendu berriak sortzeko Generative Adversarial Network (GAN) sareak erabili dituzte robotak ikas dezan, eta analisi estatistikoak erabiliz egiaztatu dute beste sistema batzuekin baino mugimendu natural eta espontaneoagoak egiten dituela.

Robotika sozialaren arloan gero eta gehiago eskatzen da robotek gizakien antzeko portaera izatea, gizakiaren eta robotaren arteko interakzioa egokiagoa izan dadin. Hizketak paper garrantzitsua jokatzen du horretan, baina baita hitz egitean egiten diren keinu espontaneoek ere, hitzen esanahia indartzen baitute, eta sentimenduak adierazten baitira hitzezkoak ez diren keinuen bidez. “Orain arte, robota hitz egiten jartzen genuenean, aurretik grabatutako zenbait mugimendu erreproduzitzen zituen ausaz etengabe, oso espontaneotasun mugatua zeukan, eta mugimendu berriak sortzea erabaki genuen: aurretik genituen datuetatik edo mugimenduetatik ikasi, eta robota, hitz egitean, mugimendu berriak sortzeko gai izatea”, azaldu du Igor Rodriguez UPV/EHUko Informatika Fakultateko Robotika eta Sistema Autonomoen Ikerketa Taldeko ikertzaileak.

Espontaneotasun-maila handitzeko GAN sareak erabili dituzte, Generative Adversarial Network sare neuronal sakonak. Igor Rodriguez lanaren egile nagusiak adierazi duenez, “sare hauek batez ere irudiekin, musikarekin eta ahotsarekin erabiltzen dira, irudi, musika eta ahots berriak sortzeko. Eta mugimendu berriak sortzeko erabiltzea erabaki genuen; izan ere, GAN sare hauek datuetatik ikasten dute eta, gero, datu horiek imitatzeko gai dira, alegia, gauza berriak sortzeko gai dira, oso antzekoak baina berriak”.

Rodriguezek azaldu duenez, “GANa bi sarez osatuta dago: bat sortzailea da, eta bestea, diskriminatzailea. Sortzailea saiatzen da gauzak sortzen, eta diskriminatzaileak, benetako datuen ezagutza duenez, esaten dio ea sortutako hori egiazkoa den edo ez. Sare horiek eboluzionatzen joaten dira, eta, azkenean, sare sortzaileak mugimendu berriak sortzen ikasten du. Sare sortzaile horren eredua integratu dugu gure robotaren arkitekturan, hitz egiten duenean denbora errealean mugimenduak sor ditzan”.

Taldeak garatutako mugimendu-sorkuntzarako sistemaren egokitasuna kuantitatiboki neurtzeko, beste sorkuntza-hurbilketa batzuekin alderatu dute. Konparaketan, robotak sortutako mugimenduen naturaltasuna aztertu dute zenbait parametro estatistikoren bidez: mugimenduen bibrazioa, mugimenduen luzera, etab. Emaitzek agerian utzi dutenez “GANekin sortutako mugimenduak naturalagoak dira, ez dute asko bibratzen, mugimendu harmonikoak egiten ditu, gorabehera handirik gabeak”, dio ikertzaileak. Zenbait bideo argitaratu dituzte robotaren portaeraren naturaltasuna agerian uzten dutenak.

Rodriguezek adierazi du sistema hau beste robot-mota batzuetan ere erabil daitekeela, azken batean “guk motorren posizioak sortzen ditugu, eta beste robot-mota batean erabili beharko bagenu sistema hau, robot horren mugimenduen datuak jaso beharko genituzke eta sarea berriz entrenatu”.  Gainera, ikerketa honetan, robotaren hizketaren testuinguruan egin dute lan, “baina robotak beste mota batzuetako mugimenduak ikas ditzan ere erabil daiteke sistema”. Ikertzailearen iritziz, aurrerapauso txiki bat da hau robotika sozialaren arloan.

Informazio osagarria

 Igor Rodriguez (Berriz, 1986) informatikan ingeniaria da, Konputazio Ingeniaritza eta Sistema Adimentsuak (KISA) masterra du eta informatikan doktore da. Gaur egun, Robotika eta Sistema Autonomoen Ikerketa Taldean (RSAIT) ari da lanean ikertzaile gisa, UPV/EHUko Donostiako Informatika Fakultateko Konputazio Zientziak eta Adimen Artifiziala Sailean.

Erreferentzia bibliografikoa