Adimen artifizialaren erabilera buru-hausgarriak ebazteko: 15 makilen jokoa

3 min

Adimen artifizialaren erabilera buru-hausgarriak ebazteko: 15 makilen jokoa

Anne Idigoras, Beñat Galdós, Imanol Echeverría, Josune Ordóñez, Mayi Echeveste, Iñigo Lopez-Gazpio

Lan honetan Deustuko Unibertsitateko ikasleok Adimen Artifiziala ikasgaiko kontzeptuak aplikatu ditugu telebistako saio batean planteatzen den buru-hausgarri bat konputazionalki ebazteko: 15 makilen jokoa. Joko honetan bi parte-hartzailek azken makila ez hartzeko elkar lehiatzen dira. 15 makilen jokoa hobeto uler dadin, gaztelaniaz dagoen bideo baten esteka ipini dugu, El Hormiguero telesaioan azaldu baitzen joko hau. Bertan Rogelio jaunak telebista saioko aurkezlearen aurka jokatzen du:

15 makilen jokoa ebazteko adimen artifiziala deskribatu dugu, batez ere bilaketa arazoetan sakonduz, jokoa bera deskribatu dugu, eta soluzio konputazional baten metodologia planteatu dugu ikasketa automatikoko metodoak erabiliz. Honela, inolako kanpo informaziorik erabiltzen ez duen software agente batek jokoa ebazten ikasten du bere buruaren aurka lehiatuz, eta jokoaren egoera irabazleak eta galtzaileak diskriminatzen ikasten du.

Bereziki, reinforcement learning deritzon ikasketan oinarritu da joko honi soluzioa eman dion kodeketa. Mekanismo honi esker, software agenteak posible dituen mugimendu guztien artean optimoenak egiten ikasten du bilaketa espazioa miatuz. Hau da, software agenteak inolako kanpo informaziorik gabe bilaketa espazioan ibilbide desberdinak miatzen doa, eta jokoa amaitzen denean irabazi edo galdu duen kontuan izanda -errefortzua- hartutako ibilbidea kalifikatzen du, hala agentearen hurrengo erabakiak hobeago eginez.

Gure inplementazioaren baliagarritasuna enpirikoki ebaluatzeko, agentearen aurka lehiatu gara hainbat aldiz, eta, software agentearen hiperparametro konbinazio egokiak aukeratutako kasuetarako, ezin izan genuen jokaldi bat bera ere irabazi. Beraz, garbi ikus daiteke software agenteak jokoa ebazteko estrategia modu latentean (hau da, bere kabuz) ikasi duela.

Honen ondoren, garatutako agentearen, eta honek jarraitzen duen ikasketa prozesuaren gaineko analisi sakon bat egin dugu. Analisi sakon hau hiru hiperparametroren inguruan egikaritu da, hiruak baitira algoritmoaren jokaera zehazten duten ezaugarriak:

Ikasketa abiadura (learning rate). Hiperparametro honek mugimenduen baliagarritasunaren aldaketa kontrolatzen du.

Agentea trebatzeko erabilitako partida kopurua. Parametro honen bidez agenteak esperientzia edo aukera handiagoa edukiko du egoera hoberenak lortzeko.

Ustiaketa eta miaketa hiperparametroa. Hiperparametro honekin agenteari adierazten zaio egoera ezberdinen aurrean zenbatetan den aske ibilbide berriak miatzeko, eta zenbatetan dagoen behartua ikasitako jakinduria ustiatzeko. Parametro hau bereziki garrantzitsua da adimen artifizialean oinarritutako agenteak trebatzeko.

Atal esperimentalak erakutsi digun modura, partida kopuruaren eta, bereziki, miaketa portzentaiaren aldaketak, emaitza onak eman dituzte, nahiz eta ikasketa abiaduraren aldaketak ondorio garbirik ez eman. Izan ere, hiru parametro hauetatik eraginkorrena miaketa portzentaia modu aldakorrean erabiltzea izan da, eta ez modu estatiko batean (hau da, balio bakarra ematea esperimentu guztiaren iraupenean), agenteak gutxika-gutxika ikasi baitu egoera hoberenak hautatzen, eta azkenean, egoera horiek ustiatzen ditu soilik. Azkenik, ondorioak zein etorkizuneko lanak planteatu ditugu, adibidez: jokoarentzako interfaze grafiko bat diseinatzea, ideia berrien miaketa egitea ikasketa abiadura hiperparametroan aldaketak egiteko, heuristikoen inplementazioa saiatzea, etab…

Iturria

Idigoras, Anne; Galdós, Beñat; Echeverría, Imanol; Josune Ordóñez, Echeveste, Mayi; Lopez-Gazpio, Iñigo (2020). «Adimen artifizialaren erabilera buru-hausgarriak ebazteko: 15 makilen jokoa»; Ekaia, 37, 2020, 305-325. (https://doi.org/10.1387/ekaia.20831)

Artikuluaren fitxa

Aldizkaria: Ekaia
Zenbakia: Ekaia 37
Artikuluaren izena: Adimen artifizialaren erabilera buru-hausgarriak ebazteko: 15 makilen jokoa.
Laburpena: Artikulu honetan Deustuko Unibertsitateko ikasle talde batek Adimen Artifiziala ikasgaiko kontzeptuak aplikatzen dituzte telebistako saio batean planteatzen den buru-hausgarri bat konputazionalki ebazteko: 15 makilen jokoa. 15 makilen jokoa buru-hausgarri motako joko bat da non bi parte-hartzaile azken makila ez hartzeko elkarren kontra lehiatzen diren. Arazo hau ebazteko, adimen artifiziala deskribatzen da, batez ere bilaketa arazoetan sakonduz, 15 makilen jokoa deskribatzen da eta soluzio konputazional baten metodologia planteatzen da ikasketa automatikoko metodoak erabiliz. Honela, inolako kanpo informaziorik erabiltzen ez duen software agente batek jokoa ebazten ikasten du bere buruaren aurka lehiatuz, eta jokoaren egoera irabazleak eta galtzaileak diskriminatzen ikasten du. Bukatzeko, garatutako software agentearen eta honek jarraitzen duen ikasketa prozesuaren gaineko analisi sakon bat egiten da. Azkenik, ondorioak zein etorkizuneko lanak planteatzen dira.
Egileak: Anne Idigoras, Beñat Galdós, Imanol Echeverría, Josune Ordóñez, Mayi Echeveste, Iñigo Lopez-Gazpio
Argitaletxea: UPV/EHUko argitalpen zerbitzua
ISSN: 0214-9001
eISSN: 2444-3255
Orrialdeak: 305-325
DOI: 10.1387/ekaia.20831

Egileez

Anne Idigoras, Beñat Galdós, Imanol Echeverría, Josune Ordóñez, Mayi Echeveste, Iñigo Lopez-Gazpio Deustuko Unibertsitateko ikasleak dira

Ekaia aldizkariarekin lankidetzan egindako atala.

15 makilen jokoa

Hurrengo ekitaldiak

Fernando G. Baptista. Infografia zientifikoaren esploratzailea

Testu irisgarria A+ A++ 🌙 2 min Fernando G. Baptista. Infografia zientifikoaren esploratzailea Infografia ezinbesteko tresna da zientziaren komunikazioan. Informazio konplexua ulergarri egin dezake eta hori lortzeko hainbat elementu erabil ditzake: ilustrazioak, diagramak, mapak edo grafikoak, betiere era ulergarri batean baina zehaztasunari uko egin gabe. Arrazoi honengatik, ilustratzaile zientifikoaren lana…

2026ko otsailaren 20a — 2026ko maiatzaren 31a

Arkeologia Museoa

Mallona Galtzada, 2. , Bilbo.

Eguzki-eklipse osoa. Behaketa, esplorazioa eta zientzia jardunaldia

Testu irisgarria A+ A++ 🌙 3 min Eguzki-eklipse osoa. Behaketa, esplorazioa eta zientzia jardunaldia 2026ko abuztuaren 12an aukera paregabea izango dugu gertakari astronomiko zoragarri bat bizitzeko: eguzki-eklipse osoa. 1905ean ikusi zen azkena Euskal Herrian. Eklipsea ilunabarra baino pixka bat lehenago izango da eta ez da berdin ikusiko leku guztietan. Esaterako…

2026ko maiatzaren 11a

Bizkaia Aretoa – EHU.

Abandoibarra etorbidea, 3. , Bilbo.

“El secreto de la naturaleza” dokumentalaren emanaldia eta ondorengo solasaldia Zarautzen

Testu irisgarria A+ A++ 🌙 1 min “El secreto de la naturaleza” dokumentalaren emanaldia eta ondorengo solasaldia Zarautzen Euskal Herriko Unibertsitateko Kultura Zientifikoko Katedrak ekoitzitako eta José Antonio Pérez Ledok zuzendutako Naturaren sekretua dokumentala datorren maiatzaren 19an, asteartean, 19:00etan ikusi ahal izango da Zarauzko Modelo Aretoan. Sarrera librea eta doakoa…

2026ko maiatzaren 19a

Modelo Aretoa.

Zigordia kalea, 1., Zarautz