Materia

Contenido de XSL

Lingüística de Corpus

Datos generales de la materia

Modalidad: Presencial
Idioma: Inglés

Descripción y contextualización de la asignatura

En este curso estudiaremos el uso de corpus textuales en la lingüística computacional. Empezaremos con una breve introducción a corpus lingüísticos, incluyendo las anotaciones lingüísticas y los esquemas de representación. A continuación, trabajaremos la extracción de información relevante del corpus, como pueden ser colocaciones o la extracción de palabras clave utilizando técnicas estadísticas y distribucionales. Por último, aprenderemos el lenguaje de etiquetado XML. A lo largo del curso trabajaremos con corpus en varios idiomas (inglés, español, euskera, etc).

Profesorado

Nombre	Institución	Categoría	Doctor/a	Perfil docente	Área	Email
SOROA ECHAVE, AITOR	Universidad del País Vasco/Euskal Herriko Unibertsitatea	Profesorado Agregado	Doctor	Bilingüe	Ciencia de la Computación e Inteligencia Artificial	a.soroa@ehu.eus

Competencias

Denominación	Peso
Capacidad para diseñar y gestionar recursos lingüísticos masivos (corpus textual y de voz sean monolingües, bases de datos léxicas, bases de conocimientos léxico-semánticas).	40.0 %
Habilidad para el manejo y adaptación de los métodos simbólicos más relevantes para la investigación en la tecnología de la lengua.	20.0 %
Capacidad para gestionar y diseñar sistemas basados en lenguajes estándares para el etiquetado de información lingüística (por ejemplo: XML y TEI).	40.0 %

Tipos de docencia

Tipo	Horas presenciales	Horas no presenciales	Horas totales
Magistral	10	15	25
P. Ordenador	20	30	50

Actividades formativas

Denominación	Horas	Porcentaje de presencialidad
Clases magistrales	25.0	40 %
Prácticas con ordenador, laboratorio, salidas de campo, visitas externas	50.0	40 %

Sistemas de evaluación

Denominación	Ponderación mínima	Ponderación máxima
Asistencia y Participación	20.0 %	20.0 %
Exposiciones	20.0 %	20.0 %
Portafolio	20.0 %	20.0 %
Trabajos Prácticos	40.0 %	40.0 %

Resultados del aprendizaje de la asignatura

En este curso el estudiante adquirirá conocimiento de los fundamentos de corpus lingüisticos y anotación de los mismos, incluyendo lenguajes de etiquetado como XML. Al finalizar el curso el estudiante será capaz de extraer información relevante de corpus lingüisticos basándose en análisis estadísticos.

Temario

1. Introducción a corpus lingüísticos.

2. Características y tipos de corpus.

- Ejemplos de corpus

3. Anotación de corpus.

- Etiquetas comunes y análisis de niveles

4. Representación lingüística

- El lenguaje XML

- Estándares de la representación (TEI, NAF, AWA)

Bibliografía

Bibliografía básica

Aarts, J. And Meijs, W. (eds.) (1986) Corpus Linguistics II, Amsterdam: Rodopi.

Aijmer, K. and Altenberg, B. (Eds) (1991) English Corpus Linguistics: Studies In Honour Of Jan Svari. London: Longman.

Anthony, L. (2013) ¿A critical look at software tools in corpus linguistics¿, Linguistic Research, Volume 30, Issue 2, pp. 141-161.

Baker, P. (2010) Sociolinguistics and Corpus Linguistics. Edinburgh University Press, Edinburgh.

Garside, R., Leech, G. and McEnery, T. (1997) Corpus Annotation. Longman, Harlow.

Jurafsky D., Martin J.H. (2000) Speech and Language Processing. An Introduction To Natural Language Processing Computational Linguistics and Speech Recognition. Prentice-Hall.

Lawler J., Aristar H. (1998) Using Computers In Linguistics. A Practical Guide. Routledge.

Leech, G. And Fallon, R. (1992) "Computer Corpora - What Do They Tell Us About Culture". Icame Journal, 29-50.

McEnery, T. and Hardie, A (2012) Corpus Linguistics: Method, Theory and Practice. Cambridge University Press, Cambridge.

Text Encoding And Interchange, TEI P5 (2016) Chicago And Oxford: Text Encoding Initiative.

Visualización del menú

Barra de búsqueda

Máster Erasmus Mundus en Tecnologías del Lenguaje y la Comunicación (LCT)

Materia

Contenido de XSL

Lingüística de Corpus

Datos generales de la materia

Descripción y contextualización de la asignatura

Profesorado

Competencias

Tipos de docencia

Actividades formativas

Sistemas de evaluación

Resultados del aprendizaje de la asignatura

Temario

Bibliografía

Bibliografía básica

Visualización del menú

Barra de búsqueda

Ruta de navegación

Materia

Contenido de XSL

Lingüística de Corpus

Datos generales de la materia

Descripción y contextualización de la asignatura

Profesorado

Competencias

Tipos de docencia

Actividades formativas

Sistemas de evaluación

Resultados del aprendizaje de la asignatura

Temario

Bibliografía

Bibliografía básica