Zenbakiek gobernatzen gaituzte. Estatistika hitzaren beraren etimologiak zenbakien garrantziaz ohartarazten du: gobernuak —alegia, estatuak— indartzeko zenbakiak erabiltzen zituen zientzia zen estatistika. Estatistak ziren zenbakiak aztertzen zituztenak, eta hortik, estatistika.
Lehen estatistak hainbat fenomeno kuantifikatzen saiatzen ziren, patroiak bilatu eta gizartearen arazoei konponbidea aurkitzeko. Egun, gizarte-estatistikak, ekonomia-datuak edo hezkuntzari buruzko rankingak aurkezten dituztenek (ia) beti onuraren bat lortu nahi dute. Estatistika interes partikularren tresna izan ohi da: zenbakien tiranian bizi gara.
Guztia neurtu eta konparatu nahi dugu. Mota guztietako rankingak, zerrendak eta sailkapenak aurki daitezke. Neurtezina dena ere kuantifikatu nahi izaten dugu: zoriontasuna, maitasuna, edertasuna, edo giza-bizia bera. Azken hori, esaterako, 7,9 milioi dolarretan balioztatu zuen FDAk (Food and Drug Adminstration) eta 9,1 milioi dolarretan, aldiz, EPAk (Environmental Protection Agency). Munduko biosferak ere salneurria du: 16-54 trilioi dolar/urte, hain zuzen ere. Nola egin ote dituzte kalkuluak? Guztiak “objektiboki” neurtuta eta rankingizatuta daude: herrialderik zoriontsuenak, jatetxerik onenak, bizitzeko tokirik osasuntsuenak, amoranterik egokienak, ohean trebeenak direnak… Aipatutako azken ranking horiek, ziur aski, ez diote kalte larririk eragiten gizateriari; beste batzuek, ordea, bai. Ebaluazio-tresna “objektiboak” erraz diseina daitezke zenbaki ilunetan oinarrituta, eta datuak sukaldetik igaroarazi ondoren —kutxa beltz moduko eredu matematiko ilunak erabiliz—, kutsu objektiboa duten indikatzaileak prest izango ditugu.
Sarritan, kontrol-mekanismoak edo araudiak ezar daitezke, indikatzaile horietan oinarrituta. Aitzitik, akats larria da zenbakiei bakarrik erreparatuta ondorioetara iristea: askotan nahasten dira korrelazioa eta kausa/ondorioa, esaterako. Hala ere, zenbakirik gabe argudioak ahulak dira, ez dira pisuzkoak. Hona adibidea: jende askok nik bezala pentsatzen duela badiot agian ez didazue sinetsiko, baina, jendearen % 95,87ak nik bezala pentsatzen duela esaten badut, ez al duzue serioago hartuko baieztapena?
Zenbakien, grafikoen eta irudien erabilpen okerrarekin —edo maltzurrarekin— edozer froga daiteke: zor publiko handiak ekonomia-hazkundea moteltzen duela edo zikoinek ekartzen dituztela umeak. Izan ere, neurgailu desegokia erabiltzen bada, aurkako ondoriora bidera daitezke iritziak. Hori larria izan daitekeela ikus dezazuen, azter ditzagun bi kasu: hezkuntza eta ekonomia.
Zenbakiak hezkuntzan
Hezkuntza edo hobeto esan, hezkuntza-politika, rankingitisak jota dago. Zeren araberako rankingak, ordea? Hezkuntzaren ebaluazio-sistema ezagunena PISA txostena da, ziur aski. Txostena OCDE Ekonomia Lankidetza eta Garapenerako Erakundeak argitaratzen du, hainbat herrialdetako ikasleen gaitasunak ebaluatu ondoren. PISA txostena osatzeko tokian tokiko galderak erabiltzen dira, eta euren tratamendu estatistikoa egiten da mundu mailako rankinga egiteko. Tratamendu estatistiko hori Rasch ereduan oinarritzen da eta nolabaiteko kaxa beltz modura erabiltzen da emaitzak estandarizatzeko.
S. Kreiner adituak Times Education Supplement aldizkarian azaltzen duenaren arabera, Rasch eredua egokia gerta dadin ebaluazioaren galderak edo item guztiek berdin funtzionatu behar dute parte hartzen duten herrialde guztietan, baina hori ez da gertatzen. Itemen funtzionamentu diferentziala (DIF, differential item functioning) deritzo fenomeno horri, eta gaitasun bera duten kideek item berari erantzun desberdina emateko joera dagoela adierazten du. DIF efektua dagoenean PISAren oinarri den Rasch ereduak kale egiten du, antza. Kreinerrek ikerketa baten berri eman zuen PISAren kaxa beltz horren aurka, eta laster zen OCDE kontratxostena argitaratzen. Bestelako kritikak ere ez dira gutxi, askotan hezkuntza-sistemak ebaluazioen puntuazioak hobetzera bideratzen direlako eta ez, aldiz, sistemak berak hobetzera. Edonola ere, sarritan kritikatzen da zer galdetzen den PISA ebaluazioetan, baina, nire ustez are larriagoa da txostena nola egiten den. Eta zer ondorio dituen, jakina.
Oinarrizko akatsak dituen sistema batean oinarrituta proposatzen dira legeak eta hezkuntza-politikak —LOMCEren justifikazioetako bat izan zen PISAko ebaluazioetan nota hobeak lortzea, esaterako—. Hori dela eta, ebaluazioen hurrengo pausoa rankingak dira, eta dirudienez hona ere iritsiko zaizkigu. AEBetan bezala bukatuko ote dugu? Etortzekoak diren sailkapenetan edo rankingetan hondoratuko dugu egun txar bat izan zuen ikaslearen etorkizuna? Denbora izango da lekuko. Beldurgarri samarra da, baina web gune honetara joatea gomendatzen dizuet. Bertan klik pare bat eginda ikus dezakezue, adibidez, Tennesseeko eskolarik onena Hume-Fogg Academic High School dela, edo nazio-rankingean School for the Talented and Gifted dagoela lehen postuan. Etnizitate tasak (!?), ikasle kopuruak eta ikasle/irakasle ratioak ere kontsultagai daude.
Unibertsitateen munduan ere rankingak badira: ezagunena Shanghai rankinga da —EHU 2012. urtean sartu zen eta egun 401-500 postuen artean dago—. Ranking hori eta antzeko beste batzuk egiterakoan dauden azpijokoak eta datuak lantzeko mekanismo ilunez ohartarazi dute, esate baterako, The Guardian edo The New York Times egunkariek. Ikerketak ere badira sistema zalantzan jartzen dutenak. Zenbat ikaslek edo irakaslek lortu duten Nobel saria kontuan hartzen da, esaterako. Izurra izurtu dute batzuek, eta rankingen rankingak plazaratzen dituzte: unibertsitateenak eta negozio-eskolenak, adibidez. Edonola ere, rankingetan ez dagoena ikusezina da eta, hortaz, unibertsitateak rankingetako puntuazioak hobetzen gogotsu saiatzen dira eta hori izaten dute helburu estrategiko. Oro har, akats larria da rankingak itsu-itsuan ikustea. Badaude hainbat aldagai rankingetan azaltzen ez direnak eta puntuazioetan ikusten ez direnak. Galdera garrantzitsua izaten da hau: rankingean dauden guztiak —eskolak direla, unibertsitateak direla, hezkuntza-sistemak direla— lerro berean al zeuden lasterketa hasi zenean?
Zenbakiak ekonomian
Gaia zeharo aldatuz —agian ez hainbeste—, zenbakiek ekonomian duten garrantziaren adibide batzuk ekarriko dizkizuet jarraian. Ekonomiaren arloan, oso ezaguna da 2010. urtean Harvardeko Unibertsitateko C. Reinhart eta K. Rogoff ekonomialariek ezagutzera eman zuten lana: Growth in a time of debth. Egileek 44 herrialderen azken 200 urteetako datu ekonomikoak aztertu zituzten eta analisi matematikoak honakoa baieztatu zuten: estatu baten zorra bere Barne Produktu Gordinaren % 90 baino handiagoa bada, ekonomia-hazkundea moteldu egiten da kasu guztietan, salbuespenik gabe, eta atzeraldi arriskua handia da. Ikerketaren ondorioak Europako eta AEBetako austeritate-politikak zuritzeko erabili ziren sarritan. 2013. urtean, ordea, Massachusetts Amhersteko Unibertsitateko ikasle bati —Thomas Herndoni—Reinharten eta Rogoffen emaitzak errepikatzea eskatu zioten —ekonomiako etxeko lan modura— eta ez zuen lortu. Azkenean, nolabait, egileekin harremanetan jarri eta datu guztien kalkulu-orria bidali zioten. Hau ikusi zuen: kalkulu-orrian hainbat akats zeuden, horietako asko oinarri-oinarrizkoak, eta datu zuzenekin ondorioa ezin zen baieztatu. Reinhartek eta Rogoffek Excel orri batekin egindako akatsa onartu zuten, baina, kaltea eginda zegoen. Zenbat langabezia eragin ote du akats aritmetiko horrek?
Ekonomian beste hainbat adibide aipa daitezke: zenbakiekin obsesio izugarria dago, baina zenbaki horiek nola lortzen diren pentsatu gabe. Maiz entzuten dira albisteak BPGaren bilakaeraz, hemen jaitsi dela, han igo dela. Bai, prostituzioa eta drogak BPGan sartu zirenean aberatsagoak egin ginen estatistikari esker. Sarritan esaten da BPGa herrialdearen ongizate mailaren adierazle dela, baina, indikatzaileari buruzko hausnarketa sakona eskatzen dute batzuek, besteak beste, Joseph Stiglitz Ekonomiako Nobel saridunak.
Era berean, zorra neurtzen duten rating agentziek —haien artean The Big Three: Standard & Poor’s, Moody’s eta Fitch nagusi— botere izugarria hartu dute azken hamarkadetan. Horiek ere datu ekonomikoen tratamendu ilunak egiten dituzte, zor-jaulkitzaileak “objektiboki” ebaluatzeko. Entzutetsua izan zen, esaterako, Enron edo Lehman Brothers konpainiak porrot egin baino egun batzuk lehenago kalifikazio maximoak lortu zituztela, agentzien arabera.
Arrisku-primari buruz ere asko hitz egin daiteke. Baita burtsako datuak emateko temati jartzeko duten eraz ere. 1980ko hamarkada iritsi baino lehen, ekonomia hedabide espezializatuek bakarrik aipatzen zituzten. Egun, hedabideek sistematikoki lotzen dituzte burtsako akzioen balioa eta gizartearen ongizatea, baina, datu horiek burtsan kotizatzen duten enpresa handien egoeraren adierazle baino ez dira. Kritikak badira ekonomiaren eta burtsa-datuen arteko deskonexioa agerian jartzen dutenak. Zenbaki ulergaitzen bonbardaketa, berriz ere.
Zenbakiak nonahi
Kasu gehiago ere aipa litezke. Politikan, adibidez, D’Hondt sistemak arautzen du boto kopuruaren eta aulki kopuruen arteko lotura. Ez da metodo posible bakarra eta, jakina, hautes-sistema bakoitzak itxura desberdina ematen dio errealitateari. Edo desitxura esan beharko litzateke; izan ere, balizko hautes-sistemen artean, D’Hondt legea da, hain zuzen ere, errealitatea gehien desitxuratzen duen sistemetako bat. Kasu honetan ere, garrantzitsua da lege matematikoa ulertzea eta aukera bidezkoagoak daudela jakitea.
Hedabideei emandako diru-laguntzak direla-eta, berriki beste adibide polit bat ikusi dugu: parametro arbitrarioetan oinarritutako indize bat proposatu —irismena—, eta ondoren indize horren ustezko objektibotasunean oinarritu laguntzak esleitzeko. Ikerkuntzan ere, beste horrenbeste esan daiteke, adibidez, eragin indizeari buruz edo argitalpen-kopurua ebaluatzeari buruz. Eragin indize altuko aldizkarietan argitaratzea bilakatu da urrezko lege, baina, zalantzan jartzekoa da artikulu bat argitartazen duen aldizkariaren eragin indizeak artikuluaren beraren kalitatea bermatzen ote duen. Egia da azaldutakoak kasu oso desberdinak direla: luze eta zabal hitz egin daiteke horietaz, bakoitzak artikulu oso bat merezi baitu. Dena den, guztietan antzekoa da ondorioa: zenbakiez fio gara, nola lortu diren gehiegi ulertu (nahi) gabe.
Eman ditudan zertzelada horiekin ez dut esan nahi, noski, ranking guztiak okerrak direnik edo gauzak neurtu behar ez direnik. Neurketek informazio interesgarria ematen dute, baina, azpimarratu nahi dut zenbakien erabilera okerrak ondorio larriak izan ditzakeela. Kontuan hartu behar da zenbakiak nola lortu diren, euren atzean zer dagoen. Estatistika bi ahoko ezpata da: zenbaki txarrak sartzen badira kaxa beltzean, zenbaki txarrak aterako dira, noski. Ez izan fio kaxa beltzekin, zenbaki hutsekin: ondorio okerretara iristeko bide laburrena izaten da hori. Zenbakiek konfiantza ematen dute, zenbakiak argudio boteretsuak dira, eta horregatik erabiltzen dira hainbeste: haiek gobernatzen gaituzte. Horretaz hitz egingo datozen egunotan “Eguneroko estatistikaren oinarriak: errealitatea manipulatzeko (edo horretaz konturatzeko) teknikak” UEUko ikastaroan, Eibarren. Zenbakikraziaz.
Egileaz: Josu Lopez-Gazpio (@Josu_lg) Kimikan doktorea da eta EHUko Kimika Aplikatua saileko ikertzailea da.
2 iruzkinak
[…] Matematikariak asko hitz egiten ari dira legez kanpoko zenbakien inguruan azkenaldian. Esate baterako, 2007an eztabaida sortu zen hurrengo zenbakiarekin: […]
[…] ongi ulertzeko baliabiderik gabe. Halako hutsen iturririk behinenak aurkezten dizkigu Paulosek, adibide hurbilez eta azalpen bixi-bixiz: portzentajeak, probabilitateak, joko-apostuak, zenbaki handiak, […]