Bilaketa aurreratua

Ogi apurrak

Egungo Testuen Corpusa (ETC)



—21. mendeko ereduzko corpusa—

denera: 355,4 milioi testu-hitz

garaia: 2001/2019
hirugarren argitaraldia: 2021-02-15
bigarren argitaraldia: 2016-05-06
lehen argitaraldia: 2013-03-11

lemak: 93.418
hitz desberdinak: 3.081.228

Eskerrak eman nahi dizkiegu corpus honen osaketan euren testuak eskuzabal eman dizkigutenei:

  • Berria egunkaria
  • Argia astekaria
  • Goienkaria astekaria
  • Herria astekaria
  • Udako Euskal Unibertsitatea (UEU)
  • UPV/EHUko Euskara Zerbitzua
  • UPV/EHUko Argitalpen Zerbitzua
  • UPV/EHUko Euskara Juridikoaren Ataria
  • Elkar, Txalaparta eta Igela argitaletxeak
  • Pausoka ekoiztetxea eta EITB
  • Jakin aldizkaria
  • Elhuyar Fundazioa

Hona corpusaren ezaugarriak, osaketari dagokionez:

Iturburuaren arabera
203,8 prentsa
132,6 Berria
19,3 Goienkaria
17,0 Egunkaria
16,2 Argia
11,0 Herria
7,8 Hitzak
55,2 literatura, saiakera
28,5
EPG-EPDko liburuak
5,6
Pentsamenduaren Klasikoak
3,9
Jakin
17,2
beste liburu batzuk
38,9 zientzia, zuzenbidea
13,3
UEU
12,1
UPV/EHU
7,9
Zuzenbide Corpusa
4,2
ZT Corpusa
1,4
ZIO bilduma
10,1 telebista (Goenkale)
47,4 entziklopedia (Wikipedia)
Jatorrizkoa/itzulpena
64,0 jatorrizkoa
40,3 itzulpena
251,2 neutroa
(ezin jakin bata edo bestea den)
Urtez urte
14,2 2001
14,8 2002
11,7 2003
17,0 2004
15,6 2005
18,1 2006
19,9 2007
20,0 2008
19,7 2009
16,4 2010
14,9 2011
16,8 2012
15,9 2013
15,9 2014
15,1 2015
15,6 2016
16,9 2017
15,2 2018
15,1 2019
47,4 neutroa
(ezin jakin zein urtekoa den)
 
 

Egileak: Ibon Sarasola (Euskal Herriko
Unibertsitatea UPV/EHU), Pello Salaburu
(Euskal Herriko Unibertsitatea UPV/EHU),
Josu Landa (Ametzagaiña).

ISBN: 978-84-693-9891-3

 
kk1
kk2
  • Besterik gabe, lemak bilatzen dira. Lemaren lehen letrak idazten hasita, hasiera hori duten lemen zerrenda ageri da:

    bukatu

    “bukatu” lemaren forma guztiak aintzat hartuko dira.

  • Hitz edo forma soila bilatu nahi bada, aurretik itsatsita marratxoa (“-”) ipini. Adibidez:

    -bukatzerakoan

  • Hasiera zehatz bateko hitz edo forma guztiak bilatu nahi badira, amaieran itsatsita izartxoa (“*”) ipini. Adibidez:

    -bukatze*

    “bukatze” hasiera duten hitz guztiak kontuan hartuko dira.

    Oharra: izartxoa erabiltzeak asko moteltzen du bilaketa.

  • Hitz edo lemen segidak ere bila daitezke. Adibidez:

    -bukatutzat eman

    “bukatutzat” hitza eta ondoren “eman” lema duten kateak bilatuko dira.

  • Hitz edo lema horien arteko gehienezko distantzia ere zehaztu daiteke, tartean zenbaki bat idatziz:

    -bukatutzat 3 eman

    “bukatutzat” hitzaren eta “eman” lemaren artean bi hitz egon ahal izango dira.

  • Lemak elkarren artean erka daitezke, “|” zeinuaz banatuta. Adibidez:

    bukatu | amaitu | bururatu

    “bukatu”, “amaitu” eta “bururatu” lemen emaitzak batera bistaratzen dira. Gehienez, lau lema idatzi.

  • Aurreko bi aukerak konbinatzerik ere badago. Adibidez:

    -bukatutzat 3 eman | eman 3 -bukatutzat

Nodoa: liferay1.lgp.ehu.eus