euskaraespañol

Sare sozialak campusa

Pello Salaburu

Hiztegiez

Hizkuntzalaria eta UPV/EHUko errektore ohia

  • Cathedra

Fecha de primera publicación: 17/03/2022

Pello Salabur, lingüista y exrector de la UPV/EHU. Foto: Fernando Gómez. UPV/EHU.

Este artículo se publica en el idioma en que ha sido escrito.

Hiztegia hizkuntza jakin batean (edo jakin batzuetan) ibiltzen ditugun hitzen bilduma da, arruntean alfabeto hurrenkeran zerrendatzen dena. Hitzarekin batera hitz horren definizioa ere ematen da, hitzak duen esanahia alegia, eta adibideak.

Hola, edo antzera, definitzen dira hiztegiak hizkuntzetan zehar. Jakina, hiztegiek ez dituzte, hala ere, delako hizkuntza horren hitz guztiak biltzen: hiztegian "adiskide" agertuko da, eta "izan", baina ez "adiskidearekin" edo "nintzen", horiek guztiak euskal hitzak izanik ere. Esan nahi baita, hiztegietan eduki lexikoa duten hitzak bakarrik biltzen direla, esanahi lexiko zuzena dutenak alegia ("lema" deituko diegu hemen), ez haien aldaera morfologikoak (nahiz, egungo baliabideekin, hori ere biltzea batere zaila ez den). Eta lemetara mugaturik ere, hiztegietan milaka lema gelditzen dira bildu gabe: toki mugatuetan ibiltzen direlako, berriak direlako, zaharkituak, inork ere bildu ez dituelako, eta abar. Hiztegi hoberenak –‘Webster’s Third New International Dictionary’ (2002) aipatzen da horien artean-- ez dira 476.000 lema hitzetatik pasatzen. Orain dela urte batzuk argitaratu zuten Science egun arte ezagutzen den hizkuntza corpusik handienaren (ez da publikoa, 500.000 M hitz ditu) ikerketa: milioi bat lema baino gehiago aurkitu zituzten. Horietako milaka dozena batzuk azken urteetan sortuak. Ingelesaz ari gara.

Hiztegien artean mota asko desberdindu daitezke. Hiztegi batzuk, adibidez, historikoak dira: historian zehar (halako epe mugatu batzuetan) idatzitako testuetan oinarritzen dira lema horien zerrenda egiteko. ‘Orotariko Euskal Hiztegia’ (OEH) da egun euskararen kasuan eskura dugun hiztegi historiko aipagarriena: lehenbiziko lekukotasunetatik 1970a arte, goiti-beheiti, eskribitutako testuetan oinarritzen da. Beste hiztegi batzuk etimologikoak dira. Euskaltzaindiak argitaratu berri du, adibidez, ‘Euskal Hiztegi Historiko-Etimologikoa’, (2021): informazioa ematen digu lema bakoitzaren lehenbiziko agerpenaz edo hitzaren jatorriaz. Hola, "agur" hitzaren lehenbiziko lekukotasuna Eugenio de Salazar madrildarraren testu batean aurkitzen dela zehazten digu (1866), edo "errege" hitza latineko "rex" izenaren akusatibotik ("regem") hartua dela. "Neke" eta "nekatu" latinetik hartutako maileguak dira. Eta "landa" zelta da.

Hiztegi orokor horietaz gain, badira hiztegi espezializatuak ere: euskalki batekoa, autore batena, garai batekoa, eta abar. Hiztegi bereziak ere badira, gaika eginak: kimikakoa, geografiako, matematikakoa... ‘Aizkora Hiztegia’ argitaratu zuen UPV/EHUk orain dela urte batzuk. Hiztegi terminologikoak dira horiek. Beraz, hiztegiak mota askotakoak izan daitezke, zertan oinarritzen den egin nahi den lema zerrenda hori.

Hiztegiak egiteko eskura ditugun baliabideak anitz aldatu dira urteetan zehar. Hiztegigileak egiteko informazioa behar da: norberak dakiena, testuak, istorioak, esaerak, kantuak, hartzen dituen oharrak... Eta hortik biltzen den informazioa aztertu behar du, ordenatu, datuak gurutzatu, eta guztia behar bezala landu, azkenean lemen zerrenda egiteko. XX. mende hasieran Azkuek argitaratu zuen hiztegia izan da urteetan zehar idazleen eta hiztegigileen mahaiko liburua. Baina baliabideei dagokienez, gaur egun testu gehiago, aberatsago eta askotarikoagoak ditugu eskura. Eta horko informazioa, corpusetan bildua, ordenagailuekin tratatzen dugu. Corpusak, azken batean, testu multzoak dira, eta gaurko baliabide informatikoek aukera ematen dute testu horietan bilatu nahi dugun informazioa automatikoki aurkitzeko. Egia da komeniko litzatekeela testu idatziez gain, ahozko grabazioak ere erabiltzea, baina informazio horren tratamendua ez da hain erraza.

Corpusen garapena ere asko aldatu da, batez ere azken urteetan. Aipatutako OEH 1970erainoko testuetan oinarritzen da. Testu horiekin 5 M inguru hitzeko corpusa osatu zen, lemak bilatu eta adibideak bereizteko, eta hola egin zen hiztegia. Lehenbiziko liburukia 1987an argitaratu zen, azkena 2005ean. Lan erraldoia, 16.000 orrialde ingurukoa, letra xehean. Jar dezagun horren parean unibertsitate honetako Euskara Institutua lantzen ari den hiztegia: ‘Egungo Euskararen Hiztegia’, EEH. Hiztegi hori ere, OEH bezala, Ibon Sarasola gure irakaslearen ardurapean argitaratzen ari da. 2010ean atera zen lehenbiziko zatia, eta hurrengo hilabeteetan emanen zaio amaiera. Bi corpusetan oinarritzen da: EPG (2000-2007ko testuak, 25 M hitz), eta ETC (XXI. mendeko testuak, 355 M hitz, OEH baino 70 aldiz handiagoa). Corpusetako hitzetatik ateratzen dira lemak, aldaera guztiak, testuinguruak eta adibideak (eta autoreak, jakina). Hola zehazten ahal da, segurtasun handiarekin, lemen esanahia, eta hautatzen dira aldi berean adibide argigarriak. Zertaz ari garen ohartzeko: hiztegi horrek baditu dagoeneko 70.000 lema, 245.000 adiera eta 500.000 adibide, informazio egokia ematen dutenak. Corpusek informazio gehiago ere ematen dute: hitz multzoena, lemen maiztasuna, hitzen erabileraren garapena, eta abar.

Hiztegigileak pazientzia behar du, sistematikotasuna, diziplina handia eta hasieratik onartutako irizpideekin segitu behar du beti, letren arteko "pisua" ez desorekatzeko, eta hiztegia bera azkenean homogeneoa izateko.