Edozein hizkuntzak bezala, euskarak ere corpusen beharra du. Testu bilduma hauek hizkuntza-lagin errealak diren heinean, berebiziko garrantzia dute hizkuntza-teknologien munduan eta ezinbestekoak dira hizkuntzalaritza-ikerketetan.
Bilduma erraldoi hauek oso erabilgarriak izaten dira eguneroko bizitzan erabiltzen ditugun hizkuntza-teknologietako tresnak garatzeko. Besteak beste, egungo testu-corpusak ortografia-zuzentzaileetan, itzulpen automatikoan eta ahots-ezagutzako sistemetan erabiltzen dira.
Baina, nolakoa da gaur egun euskal corpusgintzaren egoera? Nola erabili daiteke sarea euskarazko corpusak osatzeko? Gai honen inguruan sakontzeko Elhuyar Fundazioko Hizkuntza eta Teknologia saileko Igor Leturia ikertzailearekin izan gara. Bere esanetan, azken urteotan lan handia egin da gure hizkuntzaren corpusa hobetzeko asmoarekin.
‘Zientzialari‘ izeneko atal honen bitartez zientziaren oinarrizko kontzeptuak azaldu nahi ditugu euskal ikertzaileen laguntzarekin.