Subject

XSL Content

Corpus Linguistics

General details of the subject

Mode
Face-to-face degree course
Language
English

Teaching staff

NameInstitutionCategoryDoctorTeaching profileAreaE-mail
ARBELAIZ GALLEGO, OLATZUniversity of the Basque CountryProfesorado AgregadoDoctorBilingualComputer Architecture and Technologyolatz.arbelaitz@ehu.eus
PEREZ RAMIREZ, ALICIAUniversity of the Basque CountryProfesorado AgregadoDoctorBilingualComputer Languages and Systemsalicia.perez@ehu.eus
SOROA ECHAVE, AITORUniversity of the Basque CountryProfesorado AgregadoDoctorBilingualScience of Computation and Artificial Intelligencea.soroa@ehu.eus

Competencies

NameWeight
Capacidad para diseñar y gestionar recursos lingüísticos masivos (corpus textual y de voz sean monolingües, bases de datos léxicas, bases de conocimientos léxico-semánticas).40.0 %
Habilidad para el manejo y adaptación de los métodos simbólicos más relevantes para la investigación en la tecnología de la lengua.20.0 %
Capacidad para gestionar y diseñar sistemas basados en lenguajes estándares para el etiquetado de información lingüística (por ejemplo: XML y TEI).40.0 %

Study types

TypeFace-to-face hoursNon face-to-face hoursTotal hours
Lecture-based101525
Applied laboratory-based groups203050

Training activities

NameHoursPercentage of classroom teaching
Lectures25.040 %
Prácticas con ordenador, laboratorio, salidas de campo, visitas externas50.040 %

Assessment systems

NameMinimum weightingMaximum weighting
Attendance and participation20.0 % 20.0 %
Portfolio20.0 % 20.0 %
Practical tasks40.0 % 40.0 %
Presentations20.0 % 20.0 %

Temary

1. Introducción a corpus lingüísticos.

2. Características y tipos de corpus.

- Ejemplos de corpus

3. Anotación de corpus.

- Etiquetas comunes y análisis de niveles

4. Representación lingüística

- El lenguaje XML

- Estándares de la representación (TEI, NAF, AWA)

Bibliography

Basic bibliography

Aarts, J. And Meijs, W. (eds.) (1986) Corpus Linguistics II, Amsterdam: Rodopi.

Aijmer, K. and Altenberg, B. (Eds) (1991) English Corpus Linguistics: Studies In Honour Of Jan Svari. London: Longman.

Anthony, L. (2013) ¿A critical look at software tools in corpus linguistics¿, Linguistic Research, Volume 30, Issue 2, pp. 141-161.

Baker, P. (2010) Sociolinguistics and Corpus Linguistics. Edinburgh University Press, Edinburgh.

Garside, R., Leech, G. and McEnery, T. (1997) Corpus Annotation. Longman, Harlow.

Jurafsky D., Martin J.H. (2000) Speech and Language Processing. An Introduction To Natural Language Processing Computational Linguistics and Speech Recognition. Prentice-Hall.

Lawler J., Aristar H. (1998) Using Computers In Linguistics. A Practical Guide. Routledge.

Leech, G. And Fallon, R. (1992) "Computer Corpora - What Do They Tell Us About Culture". Icame Journal, 29-50.

McEnery, T. and Hardie, A (2012) Corpus Linguistics: Method, Theory and Practice. Cambridge University Press, Cambridge.

Text Encoding And Interchange, TEI P5 (2016) Chicago And Oxford: Text Encoding Initiative.