Salaketa faltsuak atzemateko gai den softwarea garatu du Poliziak

Juanma Gallego

VeriPol izeneko sistemak adimen hizkuntzaren prozesamendua eta ikasketa automatikoa baliatzen ditu salaketetan jasotako testuak aztertzeko eta bertan idatzita dagoenaren inguruko “ebazpen” bat emateko. %91 asmatzen omen du.

XIX. mendean Eugene Vidocq detektibeak kriminalistikaren oinarriak jarri zituenetik denbora dezente igaro da, eta askotarikoak dira delituak argitu aldera komisaldegietan erabiltzen diren teknikak. Horietako batzuk oso ezagunak dira, bai telebistan edota auzi ospetsuenetan agertu direlako: DNA bidezko identifikazioak, erretratu robotak edota hatz-aztarnak dira horren adibide.

1. irudia: Kriminalistikaren alorrean delituak atzemateko teknika ugari garatzen ari dira, besteak beste, delitua noiz eta non izango den aurreratu nahian. (Argazkia: Juanma Gallego)

Baina badira beste zenbait teknika hain ezagunak ez direnak, batez ere garapen bidean daudelako, eta segurtasunari eta norbanakoen askatasunei eragiten dieten faktore guztietan bezala, halabeharrez tentu handiz garatu behar direlako.

Adibidez, datu espazialak, denborazkoak eta jarduera kriminalari lotutako estatistikak batuz, geodelituaren arloa garatzen ari da, eta AEBtako hainbat estatutan app gisa erabiltzen hasiak dira, patruilariek erronda egin baino lehenago eremurik “beroenak” zeintzuk izan litezkeen jakin dezaten. Gugandik gertu, duela hainbat urte Gasteizko Delituen Atlasa osatu zuen Eileen Matz ikasleak, Udaltzaingoarentzat erabilgarria izango zelakoan, baina Udalak ez du zabaldu izan nahi horren erabileraren inguruko informaziorik.

Datuen bidezidor beretik, bestelako aplikazioak zabaldu dira. Adibidez, Journal of Drug Issues aldizkarian argitaratutako ikerketa batean AEBtako zenbait hiritan kokainak zuen prezioari buruzko datuak erabili zituzten trafikatzaileek erabiltzen hasiak zituzten ibilbide berriak azalarazteko.

Are gehiago, neurozientziaren alorrean ere hasierako probak egin dira azken urteotan, pertsona batek esandakoa egia ote den igartzen saiatzeko, poligrafoaren famatuaren bertsio berritu bat balitz bezala. Neurozuzenbidea deitu izan zaio diziplinari. Jose Ramon Valdizan neurofisiologo espainiarra da mundu mailan teknika horietako bultzatzaile handienetako bat, eta bereziki P300 garuneko uhinaren analisia baliatu du ospa handiko hainbat kasu ikertzeko. Kazetari honi Valdizanek aitortu dio teknikak duen trabarik handiena: Espainiako legeak ez du teknika hori aintzat hartzen, eta defentsako abokatuek hori baliatzen omen dute sumario osoa bertan behera uzten saiatzeko.

Duela gutxi teknika honen aldaera berri bat aurkeztu dute. Kasu honetan, auzipetuen testigantzak ez, baizik eta lapurreta txikien haritik idatziz jasotako salaketak ikertzen duen softwarea asmatu dute. Hala izanik, ez dirudi traba legal gehiegirik izango duenik.

VeriPol izena eman diote, eta funtsean salaketen testua aztertzen duen programa bat da. Knowledge-Based Systems aldizkarian argitaratutako ikerketa artikuluan zehaztu dutenez (Researchgaten ere eskuragarri), sistema eraikitzeko hiru metodologia erabili dituzte: Hizkuntzaren Prozesamenduko algoritmoak, aldagaien aukeraketa, eta ikasketa automatikoko algoritmoak. “Honek aukera ematen digu ulertzeko jendeak nola gezurra esaten dion poliziari, eta baita benetako salaketa batek zer nolako itxura duen jakiteko”, zehaztu dute artikuluan.

Bertan azaldu dutenaren arabera, lapurretei buruz egiten diren salaketa faltsuak zehaztea zaila da, baina egileek kalkulatu dute halako salaketen %57 ez direla egiazkoak.

2. irudia: Batez ere telefono mugikorren ustezko lapurretak atzeman dituzte VeriPol ereduari esker; asko asmatzen omen dira asegurua kobratzeko. (Argazkia: Josh Felise / Unsplash)

Egoera horri aurre egin nahi izan zion Miguel Camacho Espainiako Polizia Nazionaleko inspektoreak. Polizia izateaz gain, matematikaria eta estatistikaria da Camacho, eta polizia prediktiboan doktoretza egin du Los Angeleseko UCLA Unibertsitatean. Bertatik Espainiara itzultzean bururatu zitzaion software hori garatzea, El País egunkariak argitaratutako artikulu baten arabera.

Hainbat kolaboratzailerekin batera VeriPol izeneko eredua garatu du, eta Espainiako Polizia Nazionalak salaketak biltzeko erabiltzen duen SIDENPOL izeneko fitxategian txertatu ahal izateko prestatu zuten. Modu horretan, poliziak jasotako salaketa errealekin probatu ahal izan dute tresna. Ikerketa artikuluan bertan zehazten dutenez, zientzia literaturan ikerketa helburuetarako erabili diren beste ereduak ez bezala, benetako testuekin frogatu eta balioztatu den lehen eredua da VeriPol.

Artikuluan aitortu dute oso arlo berria dela honakoa, eta, horregatik, zaila egin zaie orain arte proposatu diren beste hainbat eredurekin alderatzea. Gainera, testu faltsuak atzemateko ereduek posta elektronikoan izaten den spam-a edo internet bitartez egindako produktuen kritika faltsuak izan dituzte ohiko jomuga.

Poliziari gezurra esaten zaionean maizen erabiltzen diren hitz multzoak atzematen ditu VeriPolek. Sistema “entrenatzeko” 2015ean jasotako 1.122 salaketa izan dituzte oinarri. Horietatik 534 benetakoak ziren, eta 588, faltsuak. Salaketa horietan guztietan argi zegoen benetakoak ala faltsuak ote ziren, itxitako auziak zirelako. Gehienetan, lapurreta txikiak azaltzen zituzten salaketak ziren, hala nola mugikorren edo diru-zorroen ebasteak. Antza, salaketa gehienak sakelako telefonoarekin lapurretari lotuta daude, eta arlo honetan salaketa faltsu asko omen daude aseguruak kobratzeko. Baina erraza omen da iruzur horiek atzematea: egileen arabera, VeriPolek %91 asmatzen du. Horretan trebatuta dagoen polizia baten kasuan, asmatze tasa %75 dela kalkulatu dute.

Artikuluaren egileen esanetan, benetako salaketek zehaztasun gehiago eskaini ohi dituzte, baina salaketa faltsuetan zehaztasun horiek alboratzen dira. Era berean, benetako salaketek gertatutakoa eta lapurra bera sakontasun handiagorekin deskribatzen dituzte. Diskurtso faltsuan, berriz, ustez lapurtutako objektuan jartzen dute arreta, teorian izan den gertakarian arreta jarri beharrean. Hortaz, “asegurua”, “kontratua”, edota “iPhone” bezalako hitzak maiz agertzen dira.

Ba dira bereziki esanguratsuak diren bestelako terminoak. “Eguna” da horietako bat (“duela hiru egun lapurtu zidaten”, “ostegunean lapurtu zidaten” esan beharrean). “Motxila”, “kaskoduna” edo “beltzez jantzita” dira salaketa faltsuetan sarri errepikatzen diren terminoak.

Sinesgarritasunaren adierazle diren terminoak ere badira, hala nola “autobusa”, “tiratu” edo “hil”. Norabide berdinean, “ataria” edo “eskailburua” bezalako terminoek ere fidagarritasuna daukate, etxetik gertu izandako gertaeraren adierazle direlako; aldiz, gezurra diotenek ustezko gertakaria etxetik “urrun” kokatu nahi dute. Ezezko esaldi asko egoteak zalantzagarritasun adierazletzat hartzen da, eta baita “apenas” bezalako hitzak.

Proba pilotua izan da honakoa, baina egileek espero dute sistema polizialean txertatu ahal izatea. Iazko abenduak sistema honek Espainiako Polizia Fundazioaren Ikerketa saria eskuratu zuen, sustantzia arriskutsuak atzematea errazten duen “sudur elektroniko” batekin batera.

Erreferentzia bibliografikoa:

Quijano-Sánchez, Lara, et al., (2018). Applying automatic text-based detection of deceptive language to police reports: Extracting behavioral patterns from a multi-step classification model to understand how we lie to the police. Knowledge-Based Systems 149, 155-168. DOI: https://doi.org/10.1016/j.knosys.2018.03.010

———————————————————————————-

Egileaz: Juanma Gallego (@juanmagallego) zientzia kazetaria da.

———————————————————————————-

Eman iritzia

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>