Adimen artifizialaren erabilera buru-hausgarriak ebazteko: 15 makilen jokoa

Argitalpenak · Dibulgazioa

Lan honetan Deustuko Unibertsitateko ikasleok Adimen Artifiziala ikasgaiko kontzeptuak aplikatu ditugu telebistako saio batean planteatzen den buru-hausgarri bat konputazionalki ebazteko: 15 makilen jokoa. Joko honetan bi parte-hartzailek azken makila ez hartzeko elkar lehiatzen dira. 15 makilen jokoa hobeto uler dadin, gaztelaniaz dagoen bideo baten esteka ipini dugu, El Hormiguero telesaioan azaldu baitzen joko hau. Bertan Rogelio jaunak telebista saioko aurkezlearen aurka jokatzen du:

15 makilen jokoa ebazteko adimen artifiziala deskribatu dugu, batez ere bilaketa arazoetan sakonduz, jokoa bera deskribatu dugu, eta soluzio konputazional baten metodologia planteatu dugu ikasketa automatikoko metodoak erabiliz. Honela, inolako kanpo informaziorik erabiltzen ez duen software agente batek jokoa ebazten ikasten du bere buruaren aurka lehiatuz, eta jokoaren egoera irabazleak eta galtzaileak diskriminatzen ikasten du.

Bereziki, reinforcement learning deritzon ikasketan oinarritu da joko honi soluzioa eman dion kodeketa. Mekanismo honi esker, software agenteak posible dituen mugimendu guztien artean optimoenak egiten ikasten du bilaketa espazioa miatuz. Hau da, software agenteak inolako kanpo informaziorik gabe bilaketa espazioan ibilbide desberdinak miatzen doa, eta jokoa amaitzen denean irabazi edo galdu duen kontuan izanda -errefortzua- hartutako ibilbidea kalifikatzen du, hala agentearen hurrengo erabakiak hobeago eginez.

Gure inplementazioaren baliagarritasuna enpirikoki ebaluatzeko, agentearen aurka lehiatu gara hainbat aldiz, eta, software agentearen hiperparametro konbinazio egokiak aukeratutako kasuetarako, ezin izan genuen jokaldi bat bera ere irabazi. Beraz, garbi ikus daiteke software agenteak jokoa ebazteko estrategia modu latentean (hau da, bere kabuz) ikasi duela.

Honen ondoren, garatutako agentearen, eta honek jarraitzen duen ikasketa prozesuaren gaineko analisi sakon bat egin dugu. Analisi sakon hau hiru hiperparametroren inguruan egikaritu da, hiruak baitira algoritmoaren jokaera zehazten duten ezaugarriak:

  1. Ikasketa abiadura (learning rate). Hiperparametro honek mugimenduen baliagarritasunaren aldaketa kontrolatzen du.
  1. Agentea trebatzeko erabilitako partida kopurua. Parametro honen bidez agenteak esperientzia edo aukera handiagoa edukiko du egoera hoberenak lortzeko.
  1. Ustiaketa eta miaketa hiperparametroa. Hiperparametro honekin agenteari adierazten zaio egoera ezberdinen aurrean zenbatetan den aske ibilbide berriak miatzeko, eta zenbatetan dagoen behartua ikasitako jakinduria ustiatzeko. Parametro hau bereziki garrantzitsua da adimen artifizialean oinarritutako agenteak trebatzeko.

Atal esperimentalak erakutsi digun modura, partida kopuruaren eta, bereziki, miaketa portzentaiaren aldaketak, emaitza onak eman dituzte, nahiz eta ikasketa abiaduraren aldaketak ondorio garbirik ez eman. Izan ere, hiru parametro hauetatik eraginkorrena miaketa portzentaia modu aldakorrean erabiltzea izan da, eta ez modu estatiko batean (hau da, balio bakarra ematea esperimentu guztiaren iraupenean), agenteak gutxika-gutxika ikasi baitu egoera hoberenak hautatzen, eta azkenean, egoera horiek ustiatzen ditu soilik. Azkenik, ondorioak zein etorkizuneko lanak planteatu ditugu, adibidez: jokoarentzako interfaze grafiko bat diseinatzea, ideia berrien miaketa egitea ikasketa abiadura hiperparametroan aldaketak egiteko, heuristikoen inplementazioa saiatzea, etab…

Iturria

Idigoras, Anne; Galdós, Beñat; Echeverría, Imanol; Josune Ordóñez, Echeveste, Mayi; Lopez-Gazpio, Iñigo (2020). «Adimen artifizialaren erabilera buru-hausgarriak ebazteko: 15 makilen jokoa»; Ekaia, 37, 2020, 305-325. (https://doi.org/10.1387/ekaia.20831)

Artikuluaren fitxa

  • Aldizkaria: Ekaia
  • Zenbakia: Ekaia 37
  • Artikuluaren izena: Adimen artifizialaren erabilera buru-hausgarriak ebazteko: 15 makilen jokoa.
  • Laburpena: Artikulu honetan Deustuko Unibertsitateko ikasle talde batek Adimen Artifiziala ikasgaiko kontzeptuak aplikatzen dituzte telebistako saio batean planteatzen den buru-hausgarri bat konputazionalki ebazteko: 15 makilen jokoa. 15 makilen jokoa buru-hausgarri motako joko bat da non bi parte-hartzaile azken makila ez hartzeko elkarren kontra lehiatzen diren. Arazo hau ebazteko, adimen artifiziala deskribatzen da, batez ere bilaketa arazoetan sakonduz, 15 makilen jokoa deskribatzen da eta soluzio konputazional baten metodologia planteatzen da ikasketa automatikoko metodoak erabiliz. Honela, inolako kanpo informaziorik erabiltzen ez duen software agente batek jokoa ebazten ikasten du bere buruaren aurka lehiatuz, eta jokoaren egoera irabazleak eta galtzaileak diskriminatzen ikasten du. Bukatzeko, garatutako software agentearen eta honek jarraitzen duen ikasketa prozesuaren gaineko analisi sakon bat egiten da. Azkenik, ondorioak zein etorkizuneko lanak planteatzen dira.
  • Egileak: Anne Idigoras, Beñat Galdós, Imanol Echeverría, Josune Ordóñez, Mayi Echeveste, Iñigo Lopez-Gazpio
  • Argitaletxea: UPV/EHUko argitalpen zerbitzua
  • ISSN: 0214-9001
  • eISSN: 2444-3255
  • Orrialdeak: 305-325
  • DOI: 10.1387/ekaia.20831

Egileez

Anne Idigoras, Beñat Galdós, Imanol Echeverría, Josune Ordóñez, Mayi Echeveste, Iñigo Lopez-Gazpio Deustuko Unibertsitateko ikasleak dira


Ekaia aldizkariarekin lankidetzan egindako atala.

15 makilen jokoa

Utzi erantzuna

Zure e-posta helbidea ez da argitaratuko.Beharrezko eremuak * markatuta daude.