“Big data” delakoa askoren ahotan dabil azken urteotan baina berez, askok ez dakigu oso ondo kontzeptu hau zertan oinarritzen den. Big data honen oinarrizko ideia, eguneroko bizitzan uzten dugun urrats digitalaren azterketa litzateke, eta hiru ezaugarri nagusi lituzke: datu bolumen handiak aztertzekoa, denbora errealean egitekoa, eta datu mota desberdinak konbinatuaz egitekoak (hitzak, zenbakiak, irudiak, etab).
Big data beraz datu bolumen gero eta handiagoak erabiltzeko eta aztertzeko baliabideen garapenari eginen lioke erreferentzia.
Googleko zuzendari exekutiboa izandako Eric Schmidten hitzetan, zibilizazioaren hasieratik 2003. urtera arte, gizakiak bost exabyte datu sortu zituen, hau da 34.500 miloi musika disko MP3 formatuan izatearen baliokidea. Gaur egun gizakiak bost exabyte datu sortzen ditu bi eguneko, eta kantitate hau areagotzen doa egunetik egunera. Nola sor ditzake ordea gizakiak hainbeste datu? Belaunaldi berriko mugikor, telebista, erloju edota beste mota batzuetako aparailuen erabileren bitartez.
Adibide batzuk jartzearren, Facebook edo Twitter bezalako gizarte-sareetan mantentzen ditugun elkarrizketek, eta igotako argazki edo bideo guztiek informazio baliagarria sortzen dute enpresa hauentzat. Era berean, kreditu-txartelaren erabilpenak datuak sortzen ditu banketxeetarako eta zer esanik ez, Interneten nabigatzeak. Horri guztiari, sentsore-aparailuek sortutako datuak gehitu behar zaizkio, esate baterako mugikorraren GPS sistemak uneoro ematen duen kokapen zehatzak. Big data hauen helburu nagusia beraz hau da: nola bilakatu datu hauek guzti hauek informazio baliagarrian? Hona hainbat adibide.
Big data gaur
Starbucks, lami berdearen kafetegiak, azken urteetan pairatu duen geldialdi ekonomikoari aurre egiteko eta enpresaren etorkizuna hobetzeko asmoz, teknologia berrien bitartez lorturiko datu masiboen azterketa egitea erabaki du. Bi izan dira finkatutako helburuak: 1- Kafetegi berri bat ireki baino lehen, lokalak izan dezakeen tokian tokiko garapen ekonomikoa ezagutzea, 2- Starbucksen bezeroei eskaera eta esperientzia pertsonalizatuagoak eskaintzea.
Hala, lehen helburua betetzeko asmoz, Starbucksek Atlas sistema baten bidez deskribatua du bere enpresa-sarearen banaketa. Kafetegi bakoitzaren datuak (irabaziak, bezero kopurua, etab) gainontzeko lokalen informazioarekin konektatzen du R programa estatistikoa erabiliz. Hala, lokal berri bat ireki aurretik, “kanibalizazio ereduak” izeneko prozedura estatistikoetan oinarrituz, lokal berriak gainontzekoetan izan dezakeen eragina aurreikusteko aukera du.
Bigarrenik, Starbucksek bezeroei eskaera eta esperientzia pertsonalizatuagoak eskaintzeko asmoz, mugikorrerako aplikazio berri bat jarri du abian. Gerri Martin-Flickinger, Starbuckseko teknologia-zuzendari nagusiaren esanetan, “jendeak zer erosten duen badakigu, non eta nola erosten duen ere. Informazio hau beste datu mota batzuekin konbinatuaz (eguraldia, promozioak, inbentarioak eta lokal desberdinetan egiten diren ekitaldiak), gure bezeroei zerbitzu hobea eskaini diezaiekegu”. Aplikazio honen helburua beraz, erabiltzaile bakoitzaren ohiturak behatzea eta horretan oinarrituta fideltasuna saritzeko sistema pertsonalizatu bat garatzea da. Kontsumo jarraia egiten duten bezeroei sari edo promozio gehiago eskaintzen diete; honek bezeroen gogobetetasuna handitzen du eta hartara luzera bermatzen du bezeroaren fideltasuna. Aplikazio honek, gainera, aldaketa positiboak egiten ditu menuan. Salmentak areagotzen ez diren uneetan, garestiagoak diren kafeak kontsumitzera gonbidatuko lukete bezeroa, salmenta kopuru berdinekin irabaziak areagotzeko asmoz.
Beste adibide bat dugu Amazonen erosketa-saskian. Denok egin dugu noiz edo noiz erosketaren bat Amazon webgunean. Bertan egiten den erosketa bakoitzak enpresari irabazi ekonomikoa eskaintzeaz gain, datu oso baliagarriak ematen dizkio. Hala, zer egiten du Amazonek erosketetatik lorturiko informazioarekin? Eroslea beste produktu batzuk erostera erakarri, interesgarriak gerta lekizkiokeen beste produktu gehigarria batzuk eskainiz. Bezeroek produktu bat baino gehiago erosten dutenean, produktuak sailkatu eta zein produktu beste zeinekin erosi ohi den aztertzen du. Hala, erosle berri batek produktu horietakoren bat erosiko balu, besteak eskainiko lizkiokete (ikusi bigarren irudian).
Bestalde, erosle batek era jarraian erosketak egiten baditu, eroslearen profila osatzeko eredu estatistikoak ere erabiltzen dituzte bezeroaren arreta produktu interesgarrien bidez erakartzeko asmoz. Horrez gain, Amazonek bere prezioak uneoro aldatzen ditu. Metodo honek, erosleek prezio jakin batzuen aurrean duten sentikortasuna aztertzea ahalbidetzen dio eta erosketa-joera datu gehiago biltzea. Beraz, hauek ere Big data al dira? Noski, milaka produktu dira.
Bestetik, esan genezake Facebook datu masiboak sortzen errege dela Googlerekin batera. Ez al duzue sekula pentsatu Facebook bezalako enpresa boteretsu batek nola lortzen dituen urtean milioika eta milioika dolarretako irabaziak eskaintzen dituen baliabide eta zerbitzu guztiak doakoak badira? Gure datuak direlako bere produkturik baliotsuenak. Facebookek profil bakoitzaren azterketa sakona egiten du, gure gizarte-esparrua bereganatzen du eta ordenagailu edota mugikorra erabiliz konektatzen garen unean eurek, gure kontaktuak, gustuak, bizilekua, gainontzekoekin komunikatzeko modua, erosketak eta beste hainbat ezaugarri ezagutzen ditu. Eta zertarako behar du Facebookek informazio hau? Beren onurak lortzeko edota beste enpresa batzuei saltzeko.
Honen harira, deigarria iruditu zitzaidan kasuetako bat, Estatu Batuetako auto-aseguruetarako etxe batek erabilitako estrategia. Big data erabiliz, euren bezeroen Facebookeko profilak aztertzeko prozedurak garatu zituen auto-aseguru pertsonalizatuagoak eskaintzeko asmoz. Prozedura hori erabilita, bezeroak bitan sailkatzen ditu. Lehenik, gizarte-sare honetan esaldi motz eta zehatzak erabiltzen dituztenek, ala lagunekin biltzeko leku eta ordu zehatzak finkatzen dituztenak erabiltzaile kontziente gisa sailkatzen ditu eta beraz gidari seguru gisa. Bigarrenik, hizki larriz, harridura-ikur ugari eta hitz itsusiak erabiltzen zituztenak, oldarkor gisa sailkatzen ditu eta beraz gidari ez hain seguru gisa. Algoritmo hauek eten gabe eguneratzen dituzte eta aseguru-etxeak duen beste informazio batekin konbinatzen ditu: auto mota, erreklamazioak, parte-emateak, etab. Aseguru-etxearen esanetan, prozedura hauek gidari seguruenei deskontuak eskaintzeko soilik erabiltzen dituzte eta gizarte-sarerako sarbidea borondatezkoa da. Gidari ez seguruei polizaren prezioa ez litzaieke areagotuko printzipioz.
Big data bihar
Gaur egun, Big data hauen aplikazioak gehienbat marketin eta salmenta sektoreetan garatu diren arren, badira beste hainbat sektore ere etorkizunean aurrerakuntza handiak izanen dituztenak. Osasun publikoaren hobekuntzan hainbat dira lan esparruak. Alde batetik, giza banakoaren osasun-egoera monitorizatzeko, zaintza eta tratamendu pertsonalizatuagoak eskaintzeko, datu fisiologikoen analisi eguneratu eta zehatzagoak egiteko prozedurak garatzean oinarrituko liratekeenak daude. Bestetik, osasun zerbitzu desberdinak (urgentziak, itxaron zerrendak, etab) era dinamiko, eraginkor eta egokiago batean kudeatzen ahalbidetuko luketenak.
Etxebizitzetako argindar-kontsumoa murrizteko ere ari dira ereduak garatzen. Hauek, Big data hauetan oinarritutako teknologiaren bidez, zehatz aztertzen dute etxe bakoitzaren kontsumo pertsonala. Ideia hau aurrera daraman enpresak, azken elektrizitate argindar-fakturetan oinarrituz etxebizitza bakoitzaren kontsumo-profilak osatu eta erabiltzaileari argindar-kontsumoan aurrezteko aholku pertsonalizatuak proposatzen dizkio.
Azken adibide gisa emango dugu EUSKALMETek (Euskal Meteorologia Agentziak) jada erabiltzen dituen eguraldiaren aurreikuspen zehatzagoak egiteko prozedura, ohiko informazio iturriez gain (sateliteak, radarrak, etab..), beste hainbat informazio iturrietako datuak konbinatzen dituena (sentsoreak, gizarte-sareak, etab).
Zalantzarik gabe, Big dataren garapenak hainbat abantaila ekarriko dizkio edozein lan edo bizi-esparruri. Esate baterako, erabaki hobeak hartzen lagunduko du, denbora errealeko hartu-emanak erraztuko ditu eta edozein arlotan suerta daitezkeen arazoei konponbide zehatzagoak ematea ahalbidetuko du. Hala, baditu era berean oraindik ziurgabetasuna sortzen duten eta hobetu beharrekoak diren hainbat kontu. Hala, datuen segurtasuna, datuak babesteko politikak eta hain garrantzizkoa den norbanakoaren pribatutasuna.
Gehiago jakiteko
- EITB (2018). Big Data: una huella imborrable que dejamos en Internet
- Marr, Bernard (2015). Big Data: Using SMART big data, analytics and metrics to make better decisions and improve performance. Nueva Jersey. John Wiley & Sons.
- Cukier, K. (2014). “Big data is better data”
- Rozas, W. (2014). “Casos de uso del Big data”
- Mayer-Schönberger, V. & Cukier, K. (2013). Big data: A revolution that will transform how we live, work, and think. Boston. Houghton Mifflin Harcourt.
Egileaz: Jaione Etxeberria Nafarroako Unibertsitate Publikoko Estatistika, Informatika eta Matematika saileko irakaslea da. Matematikan lizentziatu zen UPV/EHUko Zientzia eta Teknologia Fakultatean.
2 iruzkinak
[…] trataera adimenduna gauzen fabrikazioa iraultzen ari da: 4.0 industria deitzen denaren parte da. Big Data deitu ohi dena Huge Data deitu beharko litzateke, bil eta prozesa litekeen datu kopuru ikaragarria […]
[…] eta interkonektatuagoa dagoen mundua, eta datuak eta datuotatik ateratzen den informazioa balio ekonomiko izugarria duten baliabideak dira. Bestalde, interkonexio horrekin berarekin, hacker gaizkileen* taldeek […]