Gaia

XSLaren edukia

Testu-corpusak

Gaiari buruzko datu orokorrak

Modalitatea
Ikasgelakoa
Hizkuntza
Ingelesa

Irakasgaiaren azalpena eta testuingurua

Irakasgai honetan corpusetan oinarritutako linguistika landuko da. Corpus linguistikoen sarrera eskainiko da hasiera batean, corpusak adierazteko erabili ohi diren errepresentazio-eskemekin batera. Jarraian, corpusak aztertuz atera daitezkeen zenbait neurri estatistiko azalduko dira, eta corpusetan oinarritutako analisi ohikoenak ere, hala nola, metodo distribuzionalak eta patroietan oinarritutako teknikak. Adibide gisa, euskararako, gaztelerarako, katalanerako, ingeleserako eta gaztelerarako dauden corpus nagusiak aztertuko dira.

Irakasleak

IzenaErakundeaKategoriaDoktoreaIrakaskuntza-profilaArloaHelbide elektronikoa
SOROA ECHAVE, AITOREuskal Herriko UnibertsitateaIrakaslego AgregatuaDoktoreaElebidunaKonputazio Zientzia eta Adimen Artifizialaa.soroa@ehu.eus

Gaitasunak

IzenaPisua
Capacidad de utilizar los recursos lingüísticos masivos existentes para diferentes lenguas40.0 %
Habilidad para el manejo y adaptación de los métodos simbólicos más relevantes para la investigación en la tecnología de la lengua.20.0 %
Capacidad para gestionar y diseñar sistemas basados en lenguajes estándares para el etiquetado de información lingüística (por ejemplo: XML y TEI).40.0 %

Irakaskuntza motak

MotaIkasgelako orduakIkasgelaz kanpoko orduakOrduak guztira
Magistrala101525
Ordenagailuko p.203050

Irakasgaia ikastean lortuko diren emaitzak

Irakasgai honen edukien helburua da corpusean oinarritutako linguistika ezagututzea, ikasleak corpu-etatik hainbat informazio interesgarri erauzteko gai izan datin. Azkenik, ikasleak XML markatze-lengoaia ezagutuko du.

Irakasgai-zerrenda

1. Corpusean oinarritutako linguistika: sarrera

2. Corpus motak eta ezaugarriak

- Corpus adibideak

3. Corpus-en gaineko anotazioa

- Marka usuenak eta analisi mailak

4. Erreoresentazio linguistikoa

- XML lengoaia

- informazio linguitikoa errepresentatzeko estandarrak (TEI, NAF, AWA)



Laborategiak:

- Unix tresnak

- Hitz frekuentziak eta Zipf-en legea

- Hitz Anitzeko Unitate Lexikalak

- Terminoen erauzketa

- XML eta XPath

Bibliografia

Oinarrizko bibliografia

Aarts, J. And Meijs, W. (eds.) (1986) Corpus Linguistics II, Amsterdam: Rodopi.

Aijmer, K. and Altenberg, B. (Eds) (1991) English Corpus Linguistics: Studies In Honour Of Jan Svari. London: Longman.

Anthony, L. (2013) ¿A critical look at software tools in corpus linguistics¿, Linguistic Research, Volume 30, Issue 2, pp. 141-161.

Baker, P. (2010) Sociolinguistics and Corpus Linguistics. Edinburgh University Press, Edinburgh.

Garside, R., Leech, G. and McEnery, T. (1997) Corpus Annotation. Longman, Harlow.

Jurafsky D., Martin J.H. (2000) Speech and Language Processing. An Introduction To Natural Language Processing Computational Linguistics and Speech Recognition. Prentice-Hall.

Lawler J., Aristar H. (1998) Using Computers In Linguistics. A Practical Guide. Routledge.

Leech, G. And Fallon, R. (1992) "Computer Corpora - What Do They Tell Us About Culture". Icame Journal, 29-50.

McEnery, T. and Hardie, A (2012) Corpus Linguistics: Method, Theory and Practice. Cambridge University Press, Cambridge.

Text Encoding And Interchange, TEI P5 (2016) Chicago And Oxford: Text Encoding Initiative.

XSLaren edukia

Ezin izan da edukia sortu, beranduago saiatu. Arazoak aurrera jarraitzen badu, jarri harremanetan CAUrekin (Tlf: 946014400 / Email: cau@ehu.eus / Web: https://lagun.ehu.eus).