Gorka Azkune
Gizakiok hiru dimentsiotako ikusmen zehatza dugu. Gure ingurumena ikusten dugunean, koloreak eta formak ez ezik, distantziak ere hautemateko gai gara. Hiru dimentsiotako ikusmen hori zeharo garrantzitsua da gure egunerokoan, eta bestela pentsa beza irakurleak egiten dituen atazen artean zenbat egingo lituzkeen distantziak estimatzeko gai ez balitz.
Gaitasun horren muinean, batez ere, gure aurpegian ditugun bi begiak daude. Batez ere diot, gure garunak baditu eta beste modu batzuk distantziak estimatzeko. Baina gure metodo zehatzena bi begi edukitzean oinarritzen da. Gertuko objektu bati heldu nahi diogunean, bi begien informazioaz baliatzen da garuna distantzia oso modu zehatzean kalkulatzeko. Eta hori da oraintxe bertan azalduko duguna.
Triangulazioa
Irakurleari experimentu sinple bat planteatuko diot. Har beza arkatz bat eta jar beza bere aurpegiaren aurrean, besoa ongi luzatuz. Itxi begi bat eta ikusi arkatzaren kokapena bere atzeko objektuekiko. Orain itxi begi hori eta ireki bestea. Begiratu berriro arkatzaren posizioa atzeko objektuekiko. Aldaketarik sumatu al da?
Dena ongi joan bada, irakurlea konturatu da arkatza ezker-eskuin desplazatzen dela begi bat ala bestea ixterakoan. Arkatzaren atzean dagoen objektu bat erreferentzia gisa hartuz gero, begi bakoitzak arkatzaren posizio ezberdinak ikusten ditu. Baina bi begiak irekitzen ditugunean, arkatzak posizio bakarra duela dakusagu. Zer da gertatzen ari dena?
Arkatzak baino pinguinoak politagoak direlako, esperimentu bera daukazue ikusgai hurrengo irudian:
Gure begi bakoitzak argazki kamera bat bezala funtzionatzen du. Irudi lauak ala bi dimentsiotako irudiak hautematen ditu begi bakoitzak, argazki kamera batek bezalatsu. Irudi horietan ez dago sakontasunaren aztarnarik ere. Beraz, gure ingurumenari begiratzen diogunean, uneoro bi dimentsiotako bi irudi sartzen dira gure garunera. Bi irudi horiek elkarrekin “montatuz”, gure garunak hiru dimentsiotako irudiak sortzen ditu. Horretarako oso teknika sinplea erabiltzen du: triangulazioa.
Triangulazio bidez, ezker eta eskuin irudietan agertzen diren objetktuen arteko angelu ezberdintasuna erabiltzen da objektuaren distantzia kalkulatzeko. Hurrengo irudian ongi ikusten da esandakoa. Demagun puntu bat dugula gure ingurunean. Bere koordenatuak (x, y, z) dira, hots, posizio bat du hiru dimentsiotako espazioan. Puntu horrek, ezkerreko eta eskuineko begiak ateratako irudietan posizio ezberdinak ditu. Ezkerreko irudian, puntuaren posizioa (xL, yL) den bitartean, eskuinekoan (xR, yR) izango da, non xL ≠ xR eta yL ≠ yR. Kontu izan, irudietako posizioei buruz dihardugunean bi dimentsiotako posizioei buruz mintzo garela, begi bakoitzak hautematen dituen irudiak lauak baitira. Gure begietatik irudietako puntuetara dijoazen bi zuzenak elkar ebakitzen duten tokian dago ikusten ari garen puntua. Hurrengo irudian ikus daiteke azaldu berri duguna:
Kontu egin puntuaren benetazko koordenatuak kalkulatzeko, bi begien zuzenek elkar-gurutzatu behar dutela. Horreatarako, bi begiak norabide berean orientatuta egon behar dira. Animalien erreinuan erreparatzen badugu, ezaugarri hori harrapariek betetzen dute. Untxia ala zaldia bezalako belarjaleek ostera, begiak beste modu batera dituzte jarrita. Animalia horiek ezin dute triangulazioa erabili hiru dimentsiotako ikusmena izateko.
Harraparientzat distantziak zehaztasunez estimatzea oso garrantzitsua da, bestela beste animaliak ehizatzea ez bailitzateke batere erraza izango. Belarjaleentzat ostera, garrantzitsuena ahalik eta eremu zabalena ikusi ahal izatea da, nahiz eta distantziak ez behar bezala estimatu. Beraientzat korrika alde egitea da lehentasuna, edozein mugimendu arriskutsu hauteman bezain pronto. Hor duzue begien kokapenaren garrantzia eta funtzioa animali klase bakoitzean.
Natura kopiatuz
Gizakia ez da konformatzen naturan ematen diren fenomenoak ulertzearekin bakarrik. Ez. Urrats bat gehiago emateko gai izan da naturak erabiltzen dituen mekanismoak kopiatuz. Horrela, gaur egun hiru dimentsiotako ikusmen artifizial sistemak ditugu jada martxan. Sistema horiek, bi kamaren erabileran eta triangulazioan oinarritzen dira, naturan bezalatsu.
Orokorrean, goiko irudiko moduko estereo kamerak erabiltzen dira. Kamera hauek, bi irudi ateratzen dituzte eta irudi horiek ordenagailu batera bidaltzen dira. Ordenagailuan, programa baten bidez, hiru dimentsiotako irudia kalkulatzen da.
Programa horiek lau pausu izaten dituzte:
- Irudietan agertzen diren puntu esanguratsuak detektatu
- Ezker-irudiko puntu esanguratsuak eskuin irudiko puntu esanguratsuekin parekatu eta berdinak direnak topatu
- Puntu berdinen arteko triangulazioa kalkulatu
- Puntu guztien arteko triangulazio erroreak minimizatzen dituen distantziak kalkulatu
Modu horretara, robotak bezalako sistema artifizialek hiru dimentsiotako ikusmena erabil dezakete. Agian modu horretako sistemak darabiltzan robot ospetsuena Curiosity da. Hemen duzue bere “buruan” montatuta duen estereo kamera:
Curiosity-ren kasuan, hiru dimentsiotako ikusmena erabiltzen du gauza askotarako:
- Bere mugimendua eta desplazamendua estimatzeko ingurunearekiko
- Inguruan dituen oztopoak hautemateko, beraiekin ez talka egiteko helburuarekin
- Lurrazalaren izaera estimatzeko: aldaparik ba al dagoen, aldaparen malda estimatu, lurrazala bere gainean nabigatzeko egokia den jakiteko…
Ez da makala, ezta?
Natura baino haratago
Gizakiak asmatu ditu hiru dimentsiotako bestelako ikusmen sistema batzuk ere. Estereoan oinarritzen direnez gain, badaude beste sistema batzuk gure artean. Bat gainera aski ezaguna da: Kinect ospetsua!
Bideo-jokoetan ez ezik, Kinect kamera robotikan ere oso ezaguna bilakatu da, prezio oso merkean hiru dimentsiotako ikusmena eskaintzen baitu. Baina nola funtzionatzen du aparatu horrek?
Kinect-ak argi egituratuaren printzipioak erabiltzen ditu hiru dimentsiotako irudiak lortzeko. Goiko irudian arreta jarriz gero, hiru kamera daudela dirudi, ezta? Bada ez. Borobiltxo horietako batek argi infragorriak igortzen ditu. Infragorriekin patroi ala egitura ezagun bat proiektatzen du bere inguruan, gure begiek hauteman ezin badezakete ere (kontu egin infragorriak espektro ikuskorraren azpian daudela eta beraz gure begiek ezin dituztela hauteman). Hortik dator argi egituratua izena. Ondorengo irudian adibide bat ikusiko dugu eta ziur hori ikusita, jada ulertzen hasiko garela zer den Kinect-ak egiten duena:
Kontu egin, irudian ez bezala, Kinect-ak proiektatzen dituen argi egiturak ezin direla ikusi gure begiekin. Hala ere, irudiko adibideak asko lagun diezaguke. Inguruan proiektatzen dugun patroia ala egitura marra zuzenez osatuta badago, marra horiek hartzen dituzten formak aldatu egiten dira ingurunearen geometriaren arabera. Goiko irudian ongi ikusten da hori: atzeko pareta lauean, marra zuzenak zuzen ikusten dira, baina gizonaren gorputzean bere geometriaren araberako kurbak marrazten dituzte. Beraz, kurba horiek ikusi eta beraien kurbatura kalkulatuz, ezingo al genuke ondorioztatu kurba horien arduraduna den objektuaren geometria? Erantzuna baiezkoa da.
Hori da bada Kinect gailuak egiten duena. Borobiltxo horietako batekin infragorrizko egitura batzuk proiektatzen ditu bere ingurunean. Ondoren, beste borobiltxo horietako batekin, argi infragorria hautematen du. Proiektatutako argi egiturak pairatzen dituen aldaketak ikusita, hiru dimentsiotako geometria kalkulatzen du. Azkenik, hirugarren borobiltxoa sartzen da jokoan. Hau, kamera arrunt bat da. Beraz, kamerak hartzen dituen irudiak, hiru dimentsiotako geometriarekin konbinatzen ditu hiru dimentsiotako irudiak lortzeko!
Hala ere, argi infragorriak erabiltzen dituenez, Kinect-ak ez du ongi funtzionatzen etxetik kanpora. Gure eguzkiak argi infragorri pilo bat igortzen digu, beraz Kinect kamera bat egun eguzkitsu batean kalera ateraz gero, segituan ikusiko duzu ez duela funtzionatzen. Noski, bere kamera infragorriak ezin baitu proiektatu duen egitura ikusi. Saturatu egiten da hainbeste irradiazio infragorrirekin!
Bukatzeko
Hiru dimentsiotako ikusmena oso teknologia garrantzitsua da. Robotetan ez ezik, industrian ere asko erabiltzen da piezen kalitate kontrola ala beste hainbat ataza burutzeko, eta etorkizuneko kotxe autonomoetan ere, ziur oso paper garrantzitsua izango duela. Curiosity-ren kasua benetan da azpimarratzekoa. Ingurua hautemateko duen oinarrizko sistema estereo kamera bat da. Lurrean garatu den teknologia batek hain emaitza onak ematea Marten, gizakiaren ezagutzaren mailaren erakusgarri bikaina da.
Egileaz: Gorka Azkune (@gazkune), informatikaria, eta DeustoTech-eko ikertzailea da.
Sarrera honek #KulturaZientifikoa 1. Jaialdian parte hartzen du.
2 iruzkinak
[…] Gure begiek argazki-kamera bezala funtzionatzen dute. Irudiak antzematen dituzte bi dimentsioetan, irudi lauak jasotzen dituzte baina argazkiok prozesatzerakoan gure garunak irudiak gainjarri egiten ditu eta ondorioz, hiru dimentsioetako irudiak sortzen ditu. Aipatutako prozesuari triangulazioa esaten zaio. Prozesu horren bidez […]
[…] Ra (Z=88): “Bi begi, hiru dimentsio“. Gorka Azkunek, DeustoTecheko ikertzaileak, robotikaren inguruan aritu zitzaigun Jaialdian. […]