Bilaketa aurreratua

Ogi apurrak

Egungo Testuen Corpusa (ETC)



—21. mendeko ereduzko corpusa—

denera: 430,7 milioi testu-hitz

garaia: 2001/2023
laugarren argitaraldia: 2025-01-31
hirugarren argitaraldia: 2021-02-15
bigarren argitaraldia: 2016-05-06
lehen argitaraldia: 2013-03-11

lemak: 94.438
hitz desberdinak: 3.584.978

Eskerrak eman nahi dizkiegu corpus honen osaketan euren testuak eskuzabal eman dizkigutenei:

  • Berria egunkaria
  • Argia astekaria
  • Goienkaria astekaria
  • Herria astekaria
  • Udako Euskal Unibertsitatea (UEU)
  • UPV/EHUko Euskara Zerbitzua
  • UPV/EHUko Argitalpen Zerbitzua
  • UPV/EHUko Euskara Juridikoaren Ataria
  • Elkar, Txalaparta eta Igela argitaletxeak
  • Pausoka ekoiztetxea eta EITB
  • Jakin aldizkaria
  • Elhuyar Fundazioa

Hona corpusaren ezaugarriak, osaketari dagokionez:

Iturburuaren arabera
243,8 prentsa
158,3 Berria
24,4 Goienkaria
17,0 Egunkaria
10,0 Argia
13,3 Herria
11,8 Hitzak
62,9 literatura, saiakera
34,5
EPG-EPDko liburuak
5,6
Pentsamenduaren Klasikoak
4,0
Jakin
18,8
beste liburu batzuk
45,0 zientzia, zuzenbidea
13,8
UEU
15,7
UPV/EHU
9,2
Zuzenbide Corpusa
4,8
ZT Corpusa
1,5
ZIO bilduma
10,1 telebista (Goenkale)
68,9 entziklopedia (Wikipedia)
Jatorrizkoa/itzulpena
74,2 jatorrizkoa
43,7 itzulpena
312,7 neutroa
(ezin jakin bata edo bestea den)
Urtez urte
14,2 2001
14,8 2002
11,7 2003
17,0 2004
15,6 2005
18,1 2006
19,9 2007
20,0 2008
19,7 2009
16,4 2010
14,9 2011
16,8 2012
15,9 2013
15,9 2014
15,1 2015
15,6 2016
16,9 2017
15,2 2018
15,1 2019
13,7 2020
15,3 2021
14,9 2022
12,9 2023
68,9 neutroa
(ezin jakin zein urtekoa den)
 
 

Egileak: Ibon Sarasola (Euskal Herriko
Unibertsitatea UPV/EHU), Pello Salaburu
(Euskal Herriko Unibertsitatea UPV/EHU),
Josu Landa (Ametzagaiña).

ISBN: 978-84-693-9891-3

 
kk1
kk2
  • Besterik gabe, lemak bilatzen dira. Lemaren lehen letrak idazten hasita, hasiera hori duten lemen zerrenda ageri da:

    bukatu

    “bukatu” lemaren forma guztiak aintzat hartuko dira.

  • Hitz edo forma soila bilatu nahi bada, aurretik itsatsita marratxoa (“-”) ipini. Adibidez:

    -bukatzerakoan

  • Hasiera zehatz bateko hitz edo forma guztiak bilatu nahi badira, amaieran itsatsita izartxoa (“*”) ipini. Adibidez:

    -bukatze*

    “bukatze” hasiera duten hitz guztiak kontuan hartuko dira.

    Oharra: izartxoa erabiltzeak asko moteltzen du bilaketa.

  • Hitz edo lemen segidak ere bila daitezke. Adibidez:

    -bukatutzat eman

    “bukatutzat” hitza eta ondoren “eman” lema duten kateak bilatuko dira.

  • Hitz edo lema horien arteko gehienezko distantzia ere zehaztu daiteke, tartean zenbaki bat idatziz:

    -bukatutzat 3 eman

    “bukatutzat” hitzaren eta “eman” lemaren artean bi hitz egon ahal izango dira.

  • Lemak elkarren artean erka daitezke, “|” zeinuaz banatuta. Adibidez:

    bukatu | amaitu | bururatu

    “bukatu”, “amaitu” eta “bururatu” lemen emaitzak batera bistaratzen dira. Gehienez, lau lema idatzi.

  • Aurreko bi aukerak konbinatzerik ere badago. Adibidez:

    -bukatutzat 3 eman | eman 3 -bukatutzat

Nodoa: liferay1.lgp.ehu.eus