Sare neuronalek datuak behar dituzte ikasteko. Faltsuak izan arren

Quanta Magazine

Datu errealak lortzea zaila izan daiteke; beraz, ikertzaileak datu sintetikoak erabiltzen ari dira adimen artifizialeko sistemak entrenatzeko.

Egun eguzkitsu batean, 1987. urtearen amaieran, Chevrolet kamioneta bat Pittsburgheko Carnegie Mellon Unibertsitateko campusean bihurgunez betetako baso bide batetik ibili zen. Navlab izeneko ibilgailu erraldoia ez zen nabarmentzen bere edertasunagatik edo abiaduragatik, garunagatik baizik: ibilgailu autonomo baten bertsio esperimentala zen, karga eremuan lau ordenagailu boteretsuk (garai hartarako) gidatua.

sare
1. irudia: sare neuronalak entrenatzeko, ikertzaileek gero eta gehiago erabiltzen dituzte datu sintetikoak, datu naturalak osatu edo ordezteko. (Iluztrazioa: Kristina Armitage. Iturria: Quanta Magazine)

Hasieran, Navlabez arduratzen ziren ingeniariak ibilgailua kontrolatzen saiatu ziren nabigazio algoritmo batekin, baina, aurreko ikertzaile askori bezala, zaila egin zitzaien gidatzeko baldintza sorta zabala jarraibide multzo bakar batean biltzea. Beraz, berriro saiatu ziren, oraingoan ikaskuntza automatiko izeneko adimen artifizialeko ikuspegia erabiliz: kamionetak bere kabuz gidatzen ikasiko zuen. Dean Pomerleau graduondoko ikasleak sare neuronal artifizial bat eraiki zuen, prozesamendu logikoko unitate txikiz egina. Unitate horiek garuneko zelula gisa funtzionatuko zuten, eta errepideen argazkiekin entrenatzen hasi zen, hainbat egoeratan. Baina gidatze egoeren aukera zabala barne hartzeko behar adina argazki ateratzea zailegia izan zen talde txikiarentzat; horregatik, Pomerleauk errepideen 1.200 irudi sintetiko sortu zituen ordenagailu batean, eta horiek erabili zituen sistema entrenatzeko. Makina autodidaktak ikertzaileei bururatutako beste edozein gauzak bezain ondo gidatzen zuen.

Navlabek ez zuen aurrerapen handirik ekarri gidatze autonomoan, baina proiektuak erakutsi zuen datu sintetikoek ahalmen handia zutela AAko sistemak entrenatzeko. Ikaskuntza automatikoak, hurrengo hamarkadetan hobera egin ahala, entrenamendu datuekiko ezin asezko apetitua garatu zuen. Baina datuak lortzea zaila da: garestiak, pribatuak edo urriak izan daitezke. Ondorioz, sare neuronalak entrenatzeko, ikertzaileek gero eta gehiago erabiltzen dituzte datu sintetikoak, datu naturalak osatu edo ordezteko. “Ikaskuntza automatikoa denbora luzez aritu da borrokan datuen arazoarekin”, dio Sergey Nikolenko Synthesis AI enpresako AA zuzendariak. Enpresa horrek datu sintetikoak sortzen ditu, bezeroei AAko eredu hobeak sortzen laguntzeko. “Datu sintetikoak dira arazo hau konpontzeko modu itxaropentsuenetako bat”.

Zorionez, ikaskuntza automatikoa sofistikatuagoa bihurtu den heinean, gauza bera gertatu da datu sintetiko erabilgarriak sortzeko tresnekin.

Eremu horretan, datu sintetikoak erabilgarriak dira aurpegi ezagutzari buruzko kezkak aztertzeko. Aurpegi ezagutzako sistema asko benetako aurpegien irudi liburutegi handiekin entrenatuta daude, eta irudietako pertsonen pribatutasunari buruzko arazoak sortzen ditu horrek. Alborapena ere arazo bat da, gizatalde batzuk gainordezkatuta edo azpiordezkatuta baitaude liburutegi horietan. Microsofteko Mixed Reality & AI Lab taldeko ikertzaileek kezka horiei heldu diete, eta 100.000 aurpegi sintetikoko bilduma bat atera dute AAko sistemak entrenatzeko. Aurpegi horiek haien aurpegia eskaneatzeko baimena eman zieten 500 pertsonarengandik abiatuta sortzen dira.

Microsoften sistemak hasierako multzoko aurpegietako elementuak hartzen ditu konbinazio berriak eta bakarrak sortzeko, eta, ondoren, estilo bisuala gehitzen du, makillajea eta ilea bezalako xehetasunak adibidez. Ikertzaileek diote beren datu multzoak etnia, adin eta estilo ugari biltzen dituela. “Beti dago giza aniztasun handia. Uste eta espero dugu aniztasun hori islatzea”, azaldu du Tadas Baltrušaitisek, proiektuan lan egiten duen Microsofteko ikertzaile batek.

Aurpegi sintetikoen beste abantaila bat da ordenagailuak aurpegi bakoitzeko zati bakoitza etiketa dezakeela, eta horrek sare neuronalei azkarrago ikasten laguntzen diela. Aldiz, argazki errealak eskuz etiketatu behar dira, eta horrek askoz denbora gehiago darama, eta inoiz ez da hain sendoa edo zehatza izaten.

Emaitzak ez dira fotorrealistak, aurpegiek Pixarren film bateko pertsonaien antz apur bat dute, baina Microsoftek aurpegi ezagutzako sareak entrenatzeko erabili ditu, eta sare horien zehaztasuna milioika aurpegi errealekin entrenatutako sareenaren antzekoa da.

sare
2. irudia: Microsofteko talde batek, datu errealen multzo bat erabiliz, aurpegi horiek eta beste milaka aurpegi gehiago sortu zituen. Aurpegi sintetikoek karikaturazkoak dirudite, baina sare neuronalak benetako argazkien zehaztasun berarekin entrenatzen lagun dezakete, pribatutasunari eta aniztasunari buruzko kezka gutxiagorekin. (Iturria: Microsoft)

Ordenagailuek datu sintetiko erabilgarriak sortzeko duten gaitasuna ere hobetu egin da berriki, neurri batean GPU hobeengatik (irudi errealistagoak sor ditzakeen prozesamendu grafikorako diseinatutako txip mota bat). Erroll Wood, gaur egun Googlen lan egiten duen eta aurpegi sintetikoak sortzen lagundu zuen ikertzaileetako bat da, GPUetan oinarritu zen jarraipen okularreko proiektu baterako. Jarraipen okularra egitea lan zaila da ordenagailuentzat; izan ere, eskatzen du itxura desberdineko begien mugimendurik txikienak ere jarraitzea, argiztapen baldintza askotarikoetan, baita begi globoa ia ikusten ez den muturreko angeluetan ere. Normalean giza begien milaka argazki beharko lirateke makina batek ikas dezan pertsona bat nora begira dagoen, eta argazki horiek lortzeko zailak eta izugarriki garestiak dira.

Wooden taldeak frogatu zuen ordenagailu batek, GPU batean oinarrituz eta Unity (bideojokoak ekoizteko software pakete bat) exekutatuz, beharrezko diren irudiak sor zitzakeela, irudi digitalen erreflexu zehatzak barne, giza begi kurbatu eta heze bat islatuz. GPU sistemak 23 milisegundo baino ez zituen behar izan argazki bakoitza sortzeko. (Izan ere, irudi bakoitzak 3,6 milisegundo soilik behar izan zituen sortzeko; gainerako denboran sistema irudia gordetzen aritu zen). Ikertzaileek milioi bat irudi okular sortu zituzten, eta sare neuronal bat entrenatzeko erabili zituzten. Sare horrek ondo funtzionatu zuen, sare hori bera giza begien argazki errealekin entrenatu zutenean bezain ondo, baina merkeago eta lasterrago. Microsoften aurpegi sintetikoekin bezala, jarraipen okularra egiteko sareak ordenagailuak entrenamendurako irudietako pixelei etiketa perfektuak aplikatzeko duen gaitasuna baliatu zuen.

Ikertzaileak ere AAko azken sistemak erabiltzen ari dira, AAko sistemak entrenatzeko beharrezko diren datuak sortzeko. Medikuntzan, adibidez, aspalditik dute helburutzat sare neuronal bat sortzea, irudi erradiologikoak giza erradiologoek bezain ondo interpreta ditzakeena. Baina zaila da sistema horiek entrenatzeko beharrezko diren datuak lortzea, erradiografiak eta paziente errealen tomografia konputarizatuak osasun informazio pribatua baitira. Oso neketsua da eredu zehatz bat entrenatzeko behar diren milaka edo milioika irudiak eskuratzea.

Urte honen hasieran, Hazrat Alik, Pakistango COMSATS Unibertsitateko zientzialari informatikoak, DALL·E 2 hedapen eredu ezagunarekin egindako lehen esperimentuak deskribatu zituen, X izpien irudi errealistak eta biriken tomografia konputarizatua sortzeko, biriketako gaixotasun espezifikoen irudikapenak barne. Irudi horiek erabil daitezke sare neuronal bat entrenatzeko, tumoreak eta beste anomalia batzuk detekta ditzan. Espero du urtebete barru hedapen ereduek erreferentzia puntu berri bat ezartzea AAko erradiologiako tresnetarako. “Behin erresonantzia magnetikoak, ordenagailu bidezko tomografiak eta, agian, ultrasoinu errealistagoak sintetizatu ahal ditugunean, horrek ikerketa bizkortuko du, eta, azken batean, transferentzia klinikoa ere bai, pazienteen pribatutasunari eta datu trukeari buruzko kezkarik sortu gabe”.

CMUko campusean Navlabek lotsati aurrera egiten zuen bitartean, ziurrenik ikusleek ez zuten pentsatuko teknologia garrantzitsu baten sorrera ikusten ari zirenik. Baina bidaia motel hori lagungarria izan zen munduari datu sintetikoak aurkezteko, adimen artifizialaren garapenean funtsezko zeregina hartu baitute. Eta eginkizun hori zinez funtsezkoa izan daiteke etorkizunean. “Datu sintetikoak geratzeko iritsi dira”, dio Marina Ivasic-Kos, Kroaziako Rijeka Unibertsitateko ikaskuntza automatikoko ikertzaileak. “Azken urratsa da datu sintetikoek benetako datuak erabat ordezkatzea”.


Jatorrizko artikulua:

Amos Zeeberg (2023). Neural Networks Need Data to Learn. Even If It’s Fake, Quanta Magazine, 2023ko ekainaren 16an. Quanta Magazine aldizkariaren baimenarekin berrinprimatua.

Itzulpena:

UPV/EHUko Euskara Zerbitzua.

1 iruzkina

Utzi erantzuna

Zure e-posta helbidea ez da argitaratuko.Beharrezko eremuak * markatuta daude.