Zer ikusten duten uler dezaten irakasten diete makinei

Aurpegi-edertasuna iragartzeko eta adina kalkulatzeko aurrerapenak egin ditu UPV/EHUko Computer Vision and Pattern Discovery taldeak

  • Ikerketa

Lehenengo argitaratze data: 2019/12/30

Ignacio Arganda
Ignacio Arganda. Argazkia: UPV/EHU.

Fadi Dornaika eta Ignacio Arganda UPV/EHUko Konputazio Zientziak eta Adimen Artifiziala Saileko Ikerbasque ikertzaileek hainbat aurrerapen proposatu dituzte ordenagailu bidezko ikusmenean eta ikaskuntza automatikoan. Zehazki, oso emaitza onak lortu dituzte aurpegi-edertasuna iragartzeko arloan teknika erdigainbegiratuak erabiliz, eta, bestalde, aztertu dute zer errore-funtziok laguntzen duten sareak hobeto entrenatzen, aurpegi-adina hobeto kalkulatzeko.

Adimen artifizialaren ikerketak alor ugari hartzen ditu barnean, eta haren helburua da makina adimendun ideala izan litekeena lortzea, zeina inguruneaz jabetzen baita eta xede batekin edo eginkizunen batean ahalik eta arrakasta handiena lortzeko ekintzak gauzatzen baititu. UPV/EHUko Computer Vision and Pattern Discovery taldea ordenagailu bidezko ikusmenaren eta ikaskuntza automatikoaren arloan ari da ikertzen. “Funtsean, adimen artifizialeko teknika modernoak erabiltzen ditugu askotariko irudi-problemak ebazteko, mota guztietako irudiak erabiliz: 2D, 3D, bideoak, etab.”, azaldu du UPV/EHUko Konputazio Zientziak eta Adimen Artifiziala Saileko Ignacio Arganda Ikerbasque ikertzaileak.

Izan ere, ikerketa-taldea oso gai desberdinetan dago espezializatua; besteak beste, hauetan: irudi biomedikoak (zelulen, ehunen, tumoreen eta abarren detekzioa), aurpegi-irudiak (edertasuna hautematea eta adina kalkulatzea) edota kale-irudiak (ibilgailuak, oinezkoak eta abar lokalizatzea). Eta, horretarako, beste erakunde eta ikerketa-zentro batzuetako ikertzaileekin lankidetzan jarduten dute. “Oro har, ikaskuntza automatikoko teknikak erabiltzen ditugu: normalean, datu-, irudi- edo bideo-multzo etiketatu batetik abiatzen gara (zeinetan jakina baita objektuak non dauden edo zer kategoriatakoak diren), eta haiekin irakasten diegu edo entrenatzen ditugu gure eredu estatistikoak edo adimen artifizialeko ereduak, etiketa horiek berak eslei diezazkieten sekula ikusi ez dituzten adibideei”, azaldu du Argandak.

 

Zeri erreparatzen dio sareak pertsona baten adina deduzitzeko edo edertasun-puntuazio bat emateko?

Aurpegi-irudiekin lotutako bi ikerketatan, hobekuntzak proposatu dituzte ikertzaileek, edertasuna iragartzeko eta adina kalkulatzeko. “Edertasuna iragartzeko ikerketan, datu-base batzuetan emandako edertasun-puntuazioak erreplikatzen saiatu ginen, teknika erdigainbegiratuak erabiliz (zeinetan irudi guztiak ez baitaude etiketatuta) —dio Arganda doktoreak—. Horretarako, sareak erabiltzen ditugu hainbat ezaugarri erauzteko, eta ezaugarriok edertasuna iragartzeko ereduak entrenatzeko erabiltzen dira”. Ildo horretan, taldekideek frogatu dutenez, “ikaskuntza erdigainbegiratuak teknika gainbegiratuak (zeinetan irudi guztiak etiketatuta baitaude) bezain emaitza onak edota are hobeak ematen ditu; ikaskuntza erdigainbegiratua, gainera, ez da sekula erabili mota honetako problemak ebazteko, dio.

“Adina kalkulatzeko, bestalde, sare neuronal konboluzionalak (CNN) erabiltzen dira: sarrerako irudi bat daukagu; iragazkien bidez, ezaugarri batzuk erauzten dira, laguntzen dutenak azken erabakia hartzen, alegia, zenbaki bat ematen: kasu honetan, adina”, erantsi du. Ikerketa honetan, “azterketa enpiriko bat egin genuen ikusteko zer errore-funtziok laguntzen duten sareak arlo honetan entrenatzen; izan ere, kalkuluetako errorea modu askotara minimiza daiteke”, azaldu du ikertzaileak. Esperimentalki lortutako emaitzek agerian utzi dute nola hobetu daitekeen adinaren kalkulua.

Iragarpen- eta kalkulu-mota hauetarako sare neuronal sakonak erabiltzen dira: “Konexio asko, iragazki asko, milioika datu… dituzten sareak dira. Baina garrantzitsua da ulertzea sareak zeri erreparatzen dion pertsona baten adina iragartzeko edo bestelako iragarpenak egiteko. Gaur egun, bada beste ikerketa-eremu bat, eskuartean daukaguna, adimen artifizial esplikagarri edo interpretagarri esaten zaiona eta sareak zeri erreparatzen dion azaltzeko teknikak ikertzen dituena”, azaldu du Argandak.

Halaber, ikertzaileak ohartarazi duenez, “ikaskuntza automatikoko teknikek uste baino gehiago eragiten digute gure bizimoduan. Datu asko eta asko ari dira sortzen, eta goi-mailako erabakiak hartzen dira halako sistemetan oinarrituta. Oso garrantzitsua da, beraz, faktore etikoa kontuan hartzea. Izan ere, ikaskuntza automatikoan datu-base erraldoiak erabiltzen dira eta haiekin entrenatzen dira ereduak; datu horiek dituzten joera guztiak errepikatu egiten dira ereduek egiten dituzten iragarpen eta estimazioetan, eta kaltegarria izan daiteke oso. Horren harira, datuetako joerak nola ezabatu aztertzeko, hainbat ikerketa daude zabalik”. Argandaren iritziz, “une zirraragarria bizi dugu alor honetan”.

 

Informazio osagarria

UPV/EHUko Konputazio Zientziak eta Adimen Artifiziala Saileko Ikerbasque research professor den Fadi Dornaika da Computer Vision and Pattern Discovery ikerketa-taldearen buru, eta espezializatuta dago ordenagailu bidezko ikusmenean, irudi-prozesamenduan, patroien antzematean eta ikaskuntza automatikoan. Ikerketan, Dornaika eta Argandaz gainera, Anne Elorza eta Abdelmalik Moujahid taldeko ikertzaileek hartu dute parte, baita tutoretzakidetzan dagoen Kunwei Wang doktoretza-ikasleak eta, bestalde, Ouluko Unibertsitateko (Finlandia) eta Djelfa Unibertsitateko (Aljeria) S.E. Bekhouchek ere.

Erreferentzia bibliografikoa