Zer da ikasketa automatikoa?

Quanta Magazine

Neurona-sareen eta ikasketa automatikoko beste forma batzuek, besterik ezean, proba eta errore bidez ikasten dute, pixkanaka hobetuz.

Egun, askok uste dute badakitela zer den ikasketa automatikoa: ordenagailuak “elikatzen” dira “entrenamendu datu” pila batekin, gauzak nola egin “ikas dezaten”, hori nola egin behar duten guk zehazki zehaztu behar izan gabe. Baina ordenagailuak ez dira txakurrak, datuak ez dira gozokiak, eta aurreko esaldian kakotx gehiegi daude. Zer esan nahi du, benetan, horrek guztiak?

ikasketa automatikoa
Irudia: ikasketa automatikoa adimen artifizialaren azpieremu bat da, eta giza adimena konputazionalki nola simulatu (edo gainditu) aztertzen du. (Ilustrazioa: Son of Alan – Copyright lizentziapean. Iturria: Quanta Magazine)

Ikasketa automatikoa adimen artifizialaren (AA) azpieremu bat da, eta giza adimena konputazionalki nola simulatu (edo gainditu) aztertzen du. AAko teknika batzuetan (hala nola sistema adituak) beste ikuspegi batzuk erabiltzen dira, baina ikasketa automatikoak eremuko egungo aurrerapenaren zatirik handiena sustatzen du gauza bakar batean zentratzen delako: algoritmoak erabiltzen ditu beste algoritmo batzuen errendimendua automatikoki hobetzeko.

Ikus dezagun horrek nola funtziona dezakeen praktikan, ikasketa gainbegiratua izeneko ikasketa automatiko mota komun batean. Prozesua zeregin batekin hasten da; adibidez, «argazkietan katuak identifikatzea». Helburua da zeregin hori egin dezakeen funtzio matematiko bat aurkitzea. Funtzio horrek, eredu izenekoak, zenbakien mota bat hartuko du sarrera gisa (kasu honetan, argazki digitalizatuak), eta horiek zenbaki gehiagotan bihurtuko ditu irteera gisa, «katua» edo «katua ez» dioten etiketak irudikatu ahalko dituztenak. Ereduak oinarrizko adierazpen matematiko bat du, edo forma bat, eta horrek nolabaiteko egitura ematen dio zeregina betetzeko. Hala ere, ezin dugu espero hasieratik emaitza zehatzak eman diezazkigula.

Orduan, eredua entrenatzeko unea da. Eta, horretarako, beste algoritmo mota bat hasiko da lanean. Hasteko, funtzio matematiko ezberdin batek (helburuko funtzioa) ereduaren emaitzen eta lortu nahi den emaitzaren arteko benetako «distantzia» irudikatzen duen zenbaki bat kalkulatzen du. Ondoren, entrenamendu algoritmoak helbururako distantziaren neurketa erabiltzen du jatorrizko ereduaren forma doitzeko. Ez da beharrezkoa ezer “jakitea” ereduak irudikatzen duenari buruz; besterik gabe, ereduaren zatiak (parametro izenekoak) bultzatzen ditu benetako irteeraren eta lortu nahi denaren arteko distantzia hori murrizten duten norabide matematikoetarantz.

Doikuntza horiek egin ondoren, prozesua berrabiarazten da. Eredu eguneratuak entrenamendu adibideetako sarrerak emaitza bihurtzen ditu (pixka bat hobeak); ondoren, helburuko funtzioak ereduaren beste doikuntza bat (pixka bat hobea) adierazten du. Eta horrela behin eta berriro; aurrera eta atzera, aurrera eta atzera. Interakzio nahikoak egin ondoren, entrenatutako ereduak emaitza zehatzak eman behar lituzke entrenamendu adibide gehienentzat. Hona hemen benetako trikimailua: jarduera hori mantendu behar du ere zereginaren adibide berrietan, horiek entrenamendukoetatik oso ezberdinak ez direnean.

Funtzio bat erabiltzea beste funtzio bat behin eta berriro aldatzeko lan neketsua dirudi “ikasketa automatikoa” baino. Baina hori da gakoa. Prozesu mekaniko hori abian jartzean, zereginaren hurbilketa matematiko bat sortzen da automatikoki, gizakiok xehetasun garrantzitsuak zein diren zehaztu behar izan gabe. Algoritmo efizienteekin, ondo hautatutako funtzioekin eta adibide nahikoarekin, ikasketa automatikoak programatzen jakingo ez genituzkeen gauzak egiten dituzten eredu konputazional indartsuak sor ditzakete.

Sailkapen eta aurreikuspen zereginak, hala nola argazkietan katuak identifikatzea edo mezu elektronikoen artean spama identifikatzea, oro har, ikasketa automatiko gainbegiratuaren araberakoak izaten dira. Horrek esan nahi du entrenamendu datuak aurretik ordenatuta daudela: katuak dituzten argazkiek, adibidez, «katua» etiketa daukate. Entrenamendu prozesuak dagozkion irteerentzako (ezagunak) sarreren kopuru posiblerik handiena eslei dezakeen funtzio bati ematen dio forma. Ondoren, entrenatutako ereduak ezezagunak diren adibideak etiketa ditzake.

Bestetik, ikasketa ez-gainbegiratuak egitura aurkitzen du etiketatu gabeko adibideen artean, eta aurretik zehaztuta ez dauden taldeetan multzokatzen ditu. Ikasketa ez-gainbegiratuaren menpekoak izan daitezke erabiltzaile baten aurreko portaera oinarri hartuta ikasten duten edukia gomendatzeko sistemak, bai eta ordenagailu bidezko ikuskatzean objektuak ezagutzeko zeregin batzuk ere. Zenbait zereginek, hala nola GPT-4 bezalako sistemek egiten duten hizkuntza modelatzeak, teknika gainbegiratuen eta ez-gainbegiratuen konbinazio adimendunak erabiltzen dituzte. Teknika konbinatu horiei teknika autogainbegiratu eta erdigainbegiratu deritze.

Azkenik, errefortzu bidezko ikasketak funtzio bati ematen dio forma, baina lortu nahi diren emaitzen adibideak erabili beharrean, sari seinale bat erabiltzen du. Sari hori maximizatzean proba eta errorearen bidez, eredu batek bere jarduera hobetu dezake zeregin dinamiko eta sekuentzialetan, hala nola jokatzea (xakea eta Go) edo benetako agenteen edo agente birtualen (gidaririk gabeko autoak edo elkarrizketa bot-ak, adibidez) portaera kontrolatzea.

Ikuspegi horiek praktikan jartzeko, ikertzaileek izen exotikoak dituzten algoritmoen sorta zabala erabiltzen dute, kernel makinetatik hasi eta Q-learning delakoraino. Baina 2010eko hamarkadatik, neurona-sare artifizialek leku nagusia hartu dute. Algoritmo horiek izen hori hartzen dute beren oinarrizko forma garuneko zelulen arteko konexioetan inspiratuta dagoelako, eta algoritmo oso baliagarriak izan dira ordura arte oso praktikotzat jotzen ez ziren zeregin konplexuetan arrakasta izan dutelako. Hizkuntza zabaleko ereduak, testu kate batean hurrengo hitza (edo hitz zatia) asmatzeko ikasketa automatikoa erabiltzen dutenak, mila milioika edo bilioika parametro dituzten neurona-sare «sakonekin» eraikitzen dira.

Baina baita erraldoi horiek ere, ikasketa automatikoko eredu guztiak bezalaxe, funtzioak besterik ez dira: forma matematikoak. Testuinguru egokian, tresna benetan boteretsuak izan daitezke, baina ahultasun ezagunak ere badituzte. Eredu «gaindoituak» hain doituta daude beren entrenamendu adibideetara, non ezin diren modu fidagarrian zabaldu. Horren adibidea izan daiteke katuak identifikatzeko sistema batek huts egin dezakeela argazki bat alderantziz dagoenean. Datuen alborapenak hedatu egin daitezke gaikuntza prozesuan, eta horrek emaitza distortsionatuak edo baita doitu gabeak ere eman ditzake. Eta eredu batek funtzionatzen duenean ere, ez dago beti argi zergatik funtzionatzen duen. («Interpretagarritasun» arazo horrek partikularki eragiten die ikasketa sakoneko algoritmoei.)

Hala ere, prozesua bera erraz identifikatzen da. Funtsean, makina horiek guztiek modu berean ikasten dute: aurrera eta atzera, aurrera eta atzera.


Jatorrizko artikulua:

John Pavlus (2024). What Is Machine Learning?, Quanta Magazine, 2024ko uztailaren 8a. Quanta Magazine aldizkariaren baimenarekin berrinprimatua.

Itzulpena:

UPV/EHUko Euskara Zerbitzua.

Utzi erantzuna

Zure e-posta helbidea ez da argitaratuko.Beharrezko eremuak * markatuta daude.