Bilaketa aurreratua

Ogi apurrak

Hiztegi Batua Euskal Prosan (HBEP)

[Kontsultara itzuli]

 

Hiztegi Batua Euskal Prosan

2006an hasi zen lantzen proiektu hau EHUko Euskara Institutua, Gipuzkoako Foru Aldundiaren eta Donostiako Udalaren babesarekin. Lana Ibon Sarasola eta Pello Salaburu EHUko katedradunen zuzendaritzapean egiten da. Iñaki Ugarteburu irakaslea ere lan taldean dago. Eta laugarren kidea Josu Landa da (Ametzagaiña I+G).

Jakina denez, aspaldian jarri zuen EHUk abian gaur egungo euskara idatziaren corpus zabal bat, Ereduzko Prosa Gaur izenekoa. Corpus hori da egungo euskara idatziaren erakusgarri ezin hobea, hor biltzen baitira azkeneko urteetan idatzitako liburu eredugarrienen testuak, eta, kontu hauetarako, prentsa idatziaren lekuko paregabea baita.

Orain beste urrats bat egin nahi da: Euskaltzaindia aspalditik ari da Hiztegi Batua lantzen, eta hiztegi horren lehenbiziko bertsioa 2000. urtean argitaratu zuen. Euskaltzainak bigarren itzuliko adibideak ari dira eztabaidatzen, lehenbiziko itzuliko 20.000 inguru sarrera haiek 50.000 ingurura eramateko asmoz. Lan hori Pello Salaburuk koordinatzen du. Hiztegi horrek eragin handia izan du idazleen artean, denek aitortzen dutenez, eta batasuneko bidean hainbeste gauza berdintzeko balio izan du.

Hala ere, Euskaltzaindiaren Hiztegi Batua batez ere Orotariko Euskal Hiztegian oinarritzen da, hau da, historian zehar idatzitako testuetan, nahiz ez den hori iturri bakarra. Ereduzko Prosa, ordea, gaur egungo testuetan (2000-2006, batez ere) oinarritzen da.

Kontsultatzen ari zaren hiztegi honetan (HBEP) parean jartzen dira Hiztegi Batuko sarrerak, batetik, eta Ereduzko Prosan ageri direnak, bestetik. Hau da, azken batean, parean jartzen dira Euskaltzaindiak egin duen hiztegi proposamena, batasunerako, eta benetan euskaraz, batasuna onarturik, idazten dutenek erabiltzen duten hiztegia. Informazio hau ematen da, hortaz, sarrera bakoitzari dagokionez:

  • lema hori Hiztegi Batuan ageri den edo ez
  • zenbat aldiz ateratzen den hitz hori liburuetan eta prentsan. Lema bera (hanka, adibidez), eta lemak zenbat aldaera dituen (hankekin, hanketan...).
  • nork erabiltzen duen (egileen izenak)

Kontsultak egitean ikusiko denez, badira hitz batzuk Hiztegi Batuan ageri bai, baina idazleek erabiltzen ez dituztenak. Edo alderantziz ere, esperatzekoa den gisan. Eta badira beste batzuk idazleek Hiztegi Batuko proposamena ahaztu, eta beren moldera jartzen dituztenak. Nork bere ondorioak atera ditzake hortik.

Lematizazioa egiteko baliabide informatikoak garatu ondoren, hitzak banan bana ikusi behar izan dira, eta aldez aurretik zehaztutako irizpideak betetzen zituzten hitzak bakarrik jarri dira zerrendan. Horrela, ez dira ageri hemen izen bereziak (Kant, Ibaizabal...); erratak (gainetk, hamobortz...); txokokeriatzat edo oso markatutako hizkeratzat jo daitezkeenak (guziyan, gramera...); erdaretakoak (honorary, jambon...), eta baliabide estilistikotzat hartzen direnak (hoaaaa, gaizqui...). Azkenik, behin bakarrik ageri diren hitzak ere ez dira kontuan hartu.

Orotariko Euskal Hiztegia 5 milioi hitz inguruko corpus batean oinarritzen da. Hiztegi honek, berriz, 25 milioi hitzetik gorako corpusa du azpian. Hura, batez ere testu klasikoek osatzen dute. Hau, egungo euskara idatzian, prosan, oinarritzen da, esan bezala. Denetara 46.237 lema bereizten dira hemen, eta horiek guztiak aurkituko dituzu kontsultan. Hiztegi Batuan 21.235 ageri dira, hemengoen erdia baino gutxiago horrenbestez.

Hona hemen beste datu interesgarri batzuk:

  • Hitz agerpenak (hitz guztiak, bakarka kontaturik: etxe, etxetik, etxe, etxetik lau hitz agerpen dira): 25.106.538
  • Hitz desberdinak (errepikatzen direnak kontuan hartu gabe: etxe, etxetik, etxe, etxetik bi hitz desberdin dira): 700.195
  • Lemak (hitz desberdinak: etxe, etxetik lema beraren aldaerak dira. Lema bat hor, hortaz): 46.237

Hitz desberdineko multzoa (700.195) kontuan hartzen baldin badugu, baztertu behar izan dira 255.331 (% 36,47), emandako arrazoiak direla eta (izen bereziak, erratak, txokokeriak, eta abar); beste 53.694 (% 7,67) ez dira aintzat hartu (behin bakarrik ageri direlako, adibidez). Beraz, aztertzeko eta erkaketak egiteko 391.170 (% 55,87) hitz geratu dira azkenean, eta horiek eman dira finkatutzat.

Ordea, agerpen guztiak kontuan hartuz gero (25.106.538), 1.294.355 (% 5,16) baztertu dira eta 157.576 (% 0,63) ez dira aintzat hartu. Ikusten denez, baztertutako edo aintzat ez hartutako hitzen kopurua, ehunekoetan, txikia da, nahiz banaka-banaka ikusi behar direnez, lan handia eman duen bereizketa horiek egiteak.

Esan dezagun, azkenik, datuei dagokienez, hauexek direla Hiztegi Batua eta HBEP-en arteko beste desberdintasun batzuk:

  • HBEP denera: 46.237 (% 100,00)
  • HB denera: 21.235 (% 45,93)
  • HBn ez, HBEPn bai: 25.002 (% 54,07)
  • HBn bai, HBEPn ez: 1.974 (% 4,27)
[2009ko urtarrilean beste 10.753 azpisarrera gehitu dira HBEPn; zerrendetan etzanaz ematen dira beroriek, besteetatik bereiztearren.]

Honekin bukatutzat eman daiteke HBEP, lehenbiziko bertsioan. Badira, hala ere, zenbait lan hurrengo hilabeteetan egingo direnak:

  • Zuzenketa lanak. Batetik, holako lan «bizi» batean beti itzultzen dira hutsak, eta horien azterketa egingo da. Bestetik, «Ik.» eta «Cf.» ikurrak gehituko dira, eta lema beraren barianteen arteko kopuru desberdintasunak bistaratuko dira.
  • Idazle bakarreko lemak izateagatik kanpoan geratu diren 11.223 lemak aztertuko dira hurrengo hilabeteetan, horietako zenbait interesekoak izan baitaitezke. Gehienak kanpoan uztekoak izan arren («pañuelo/painuelu/painuelo") badira beste batzuk eskuratu behar direnak.
  • Hitz bat baino gehiagoko lemak aintzat hartu behar ote diren aztertuko da. Orain, HBn ageri direnak bakarrik sartu dira hemen («dir-dir egin», «parez pare»...), baina mordoa dira Euskaltzaindiak zehaztu gabekoak, eta sartzea merezi dutenak, segur aski ere: onomatopeiak, errepikapenak, latinezkoak, terminologia kontukoak, eta abar.
  • Une honetan lema beraren barruan dauden hitz asko lema desberdinetan bereizi behar ote diren aztertuko da. Adibidez, «txo», «tsu», «dun», «ki», «ka», «arazi» atzizkiak, edo aditz izenak... askotarikoak aurkitzen dira. Aztertu egin beharko da, eta beren beregiko irizpideak erabaki, hitz deribatuak lema noiz bihur daitezkeen deliberatzeko. Teorian sorkuntza edo generazio librekoak diren atzizki horiek guztiek, noiz sortzen dute, eta noiz ez, forma lexikalizatu bat? Orain arte, hauxe da erabili den irizpidea: Hiztegi Batuan edo hiztegi honetako lemategian lema bezala ageri direnean, bereizi; bestela ez. Esate batera, Hiztegi Batuan «egite» lema bezala ageri denez, hemen ere beste horrenbeste egin da. «antolatze», «jaiste» eta beste mordoxka, aldiz, ez dago.

HBEP hiztegi hau lotua da, jakina, honen parean Euskara Institutua argitaratzen ari den Egungo Euskararen Hiztegia izeneko lanarekin.

 

2008ko iraila

Nodoa: liferay1.lgp.ehu.eus