Adimen artifizialaren erabilera buru-hausgarriak ebazteko: 15 makilen jokoa

Anne Idigoras, Beñat Galdós, Imanol Echeverría, Josune Ordóñez, Mayi Echeveste, Iñigo Lopez-Gazpio

Lan honetan Deustuko Unibertsitateko ikasleok Adimen Artifiziala ikasgaiko kontzeptuak aplikatu ditugu telebistako saio batean planteatzen den buru-hausgarri bat konputazionalki ebazteko: 15 makilen jokoa. Joko honetan bi parte-hartzailek azken makila ez hartzeko elkar lehiatzen dira. 15 makilen jokoa hobeto uler dadin, gaztelaniaz dagoen bideo baten esteka ipini dugu, El Hormiguero telesaioan azaldu baitzen joko hau. Bertan Rogelio jaunak telebista saioko aurkezlearen aurka jokatzen du:

15 makilen jokoa ebazteko adimen artifiziala deskribatu dugu, batez ere bilaketa arazoetan sakonduz, jokoa bera deskribatu dugu, eta soluzio konputazional baten metodologia planteatu dugu ikasketa automatikoko metodoak erabiliz. Honela, inolako kanpo informaziorik erabiltzen ez duen software agente batek jokoa ebazten ikasten du bere buruaren aurka lehiatuz, eta jokoaren egoera irabazleak eta galtzaileak diskriminatzen ikasten du.

Bereziki, reinforcement learning deritzon ikasketan oinarritu da joko honi soluzioa eman dion kodeketa. Mekanismo honi esker, software agenteak posible dituen mugimendu guztien artean optimoenak egiten ikasten du bilaketa espazioa miatuz. Hau da, software agenteak inolako kanpo informaziorik gabe bilaketa espazioan ibilbide desberdinak miatzen doa, eta jokoa amaitzen denean irabazi edo galdu duen kontuan izanda -errefortzua- hartutako ibilbidea kalifikatzen du, hala agentearen hurrengo erabakiak hobeago eginez.

Gure inplementazioaren baliagarritasuna enpirikoki ebaluatzeko, agentearen aurka lehiatu gara hainbat aldiz, eta, software agentearen hiperparametro konbinazio egokiak aukeratutako kasuetarako, ezin izan genuen jokaldi bat bera ere irabazi. Beraz, garbi ikus daiteke software agenteak jokoa ebazteko estrategia modu latentean (hau da, bere kabuz) ikasi duela.

Honen ondoren, garatutako agentearen, eta honek jarraitzen duen ikasketa prozesuaren gaineko analisi sakon bat egin dugu. Analisi sakon hau hiru hiperparametroren inguruan egikaritu da, hiruak baitira algoritmoaren jokaera zehazten duten ezaugarriak:

Ikasketa abiadura (learning rate). Hiperparametro honek mugimenduen baliagarritasunaren aldaketa kontrolatzen du.

Agentea trebatzeko erabilitako partida kopurua. Parametro honen bidez agenteak esperientzia edo aukera handiagoa edukiko du egoera hoberenak lortzeko.

Ustiaketa eta miaketa hiperparametroa. Hiperparametro honekin agenteari adierazten zaio egoera ezberdinen aurrean zenbatetan den aske ibilbide berriak miatzeko, eta zenbatetan dagoen behartua ikasitako jakinduria ustiatzeko. Parametro hau bereziki garrantzitsua da adimen artifizialean oinarritutako agenteak trebatzeko.

Atal esperimentalak erakutsi digun modura, partida kopuruaren eta, bereziki, miaketa portzentaiaren aldaketak, emaitza onak eman dituzte, nahiz eta ikasketa abiaduraren aldaketak ondorio garbirik ez eman. Izan ere, hiru parametro hauetatik eraginkorrena miaketa portzentaia modu aldakorrean erabiltzea izan da, eta ez modu estatiko batean (hau da, balio bakarra ematea esperimentu guztiaren iraupenean), agenteak gutxika-gutxika ikasi baitu egoera hoberenak hautatzen, eta azkenean, egoera horiek ustiatzen ditu soilik. Azkenik, ondorioak zein etorkizuneko lanak planteatu ditugu, adibidez: jokoarentzako interfaze grafiko bat diseinatzea, ideia berrien miaketa egitea ikasketa abiadura hiperparametroan aldaketak egiteko, heuristikoen inplementazioa saiatzea, etab…

Iturria

Idigoras, Anne; Galdós, Beñat; Echeverría, Imanol; Josune Ordóñez, Echeveste, Mayi; Lopez-Gazpio, Iñigo (2020). «Adimen artifizialaren erabilera buru-hausgarriak ebazteko: 15 makilen jokoa»; Ekaia, 37, 2020, 305-325. (https://doi.org/10.1387/ekaia.20831)

Artikuluaren fitxa

Aldizkaria: Ekaia
Zenbakia: Ekaia 37
Artikuluaren izena: Adimen artifizialaren erabilera buru-hausgarriak ebazteko: 15 makilen jokoa.
Laburpena: Artikulu honetan Deustuko Unibertsitateko ikasle talde batek Adimen Artifiziala ikasgaiko kontzeptuak aplikatzen dituzte telebistako saio batean planteatzen den buru-hausgarri bat konputazionalki ebazteko: 15 makilen jokoa. 15 makilen jokoa buru-hausgarri motako joko bat da non bi parte-hartzaile azken makila ez hartzeko elkarren kontra lehiatzen diren. Arazo hau ebazteko, adimen artifiziala deskribatzen da, batez ere bilaketa arazoetan sakonduz, 15 makilen jokoa deskribatzen da eta soluzio konputazional baten metodologia planteatzen da ikasketa automatikoko metodoak erabiliz. Honela, inolako kanpo informaziorik erabiltzen ez duen software agente batek jokoa ebazten ikasten du bere buruaren aurka lehiatuz, eta jokoaren egoera irabazleak eta galtzaileak diskriminatzen ikasten du. Bukatzeko, garatutako software agentearen eta honek jarraitzen duen ikasketa prozesuaren gaineko analisi sakon bat egiten da. Azkenik, ondorioak zein etorkizuneko lanak planteatzen dira.
Egileak: Anne Idigoras, Beñat Galdós, Imanol Echeverría, Josune Ordóñez, Mayi Echeveste, Iñigo Lopez-Gazpio
Argitaletxea: UPV/EHUko argitalpen zerbitzua
ISSN: 0214-9001
eISSN: 2444-3255
Orrialdeak: 305-325
DOI: 10.1387/ekaia.20831

Egileez

Anne Idigoras, Beñat Galdós, Imanol Echeverría, Josune Ordóñez, Mayi Echeveste, Iñigo Lopez-Gazpio Deustuko Unibertsitateko ikasleak dira

Ekaia aldizkariarekin lankidetzan egindako atala.

Hurrengo ekitaldiak

Bertsozientzia saioa Azpeitian

Atsotitzak esaera labur eta zorrotzak dira. Ateraldi edo sententzia gisa har daitezke eta badira pentsaera jakin baten isla ere. Horietako bat da “Jakinduriek mundue erreko dau” atsotitza, ezagutzarekiko mesfidantza agertzen duena. Baina urriaren 26an Azpeitiko Sanagustin Kulturgunean erremedioa jarriko diogu esaera zaharrari, ezagutza errimekin jantziz. Helburu horrekin, EHUko Kultura Zientifikoko…

2025ko urriaren 26a

Sanagustin Kulturgunea

Nagusia Plaza, 5. , Azpeitia

Zaintzaileen ongizatea, gizartearen ongizatea

Zaintzan aritzen direnak, familian zein arlo profesionalean, gizarte-kohesioa bermatzeko funtsezko zutabea dira. Bere papera bereziki garrantzitsua da Euskadi bezalako lurraldeetan, non Euskal Estatistika Erakundearen (Eustat) datuen arabera, 65 urtetik gorako pertsonak biztanleriaren % 23 ziren 2022an. Hala eta guztiz ere, zaintzan aritzen direnen errealitateari buruzko ikerketak oraindik ez du merezi…

2025ko urriaren 29a

Bidebarrieta Kulturgunea

Bidebarrieta kalea, 4, Bilbo

Lan-prekarietatearen eta osasun mentalaren arteko lotura

Baldintzapen biologikoetatik haratago, faktore sozialek zerikusi handia dute gure osasunean. Osasunaren gizarte determinatzaile bezala ezagutzen diren faktore horien artean ordaindutako lanak berebiziko garrantzia du, herritar gehienen biziraupenerako bitarteko nagusia izateaz gain, nortasunaren eta gizarte-onarpenaren iturri ere badelako. Lan-baldintzek okerrera egiten dutenean, lanak funtzio horiek betetzeko gaitasuna gal dezake eta arrisku…

2025ko azaroaren 7a

Bizenta Mogel Biblioteka

Komentukalea, 8., Durango

Iturria

Artikuluaren fitxa

Egileez

Utzi erantzunaEzeztatu

Utzi erantzuna