Materia

Contenido de XSL

Creando Recursos Lingüísticos

Datos generales de la materia

Modalidad
Presencial
Idioma
Inglés

Descripción y contextualización de la asignatura

El objetivo principal de esta asignatura es demostrar la importancia de poseer recursos lingüísticos (base de datos, bases de conocimiento, corpus anotados a diferentes niveles) bien diseñados (con criterios adecuados), para luego poder aprender de ellos automáticamente, realimentarlos con la nueva información obtenida, y evaluarlos cuantitativa y cualitativamente. Paralelamente, se hace hincapié la problemática encontrada al tratar las equivalencias interlingüísticas. Todo ello con un planteamiento práctico.

Profesorado

NombreInstituciónCategoríaDoctor/aPerfil docenteÁreaEmail
ALDEZABAL ROTETA, IZASKUNUniversidad del País Vasco/Euskal Herriko UnibertsitateaProfesorado AgregadoDoctoraBilingüeFilología Vascaizaskun.aldezabal@ehu.eus

Competencias

DenominaciónPeso
Conocimiento de las herramientas existentes para el procesamiento de diferentes lenguas (analizadores morfológicos, sintácticos, semánticos).20.0 %
Conocimiento de los recursos lingüísticos masivos existentes para diferentes lenguas20.0 %
Capacidad para comprender estrategias de aprendizaje automático en el procesamiento del lenguaje humano.20.0 %
Habilidad para manejar las estrategias y herramientas basadas en conocimiento para el procesamiento del lenguaje humano.20.0 %
Habilidad para el manejo y adaptación de las herramientas existentes para el procesamiento de diferentes lenguas (analizadores morfológicos, sintácticos, semánticos...).20.0 %

Tipos de docencia

TipoHoras presencialesHoras no presencialesHoras totales
Magistral101525
P. Ordenador203050

Resultados del aprendizaje de la asignatura

- Conocimiento y manejo de recursos que son referencia en el ámbito computacional, sobretodo en inglés pero también otras lenguas.

- Conocimiento y manejo de sistemas de evaluación corpus.

- Asimilación de conceptos necesarios en el ámbito de la léxico-semántica computacional: lingüística de corpus, lema/raiz/morfema, clases semánticas, acepciones y variantes, jerarquía y equivalencia conceptual (hiperonimia/hiponimia, sinonimia), relaciones semánticas, desambiguación semántica, métodos de evaluación

- Criterios lingüísticos a la hora de diseñar y construir recursos lingüísticos.

Convocatoria ordinaria: orientaciones y renuncia

- Gelako ariketak (% 50): ariketak, apunteak, kasu praktikoak...



- Proiektua (% 50): ikasgaian landutako gai bati buruzko ikerketa proiektua

Convocatoria extraordinaria: orientaciones y renuncia

- Azteketa (% 100) galdera teoriko eta praktikoekin

Temario

1) Introducción a los recursos lingüísticos

2) Bases de conocimiento y corpus relacionados: wordnets, MCR, SemCor, SUMO

2a) Cuestiones lingüísticas: gaps conceptuales, conceptos culturales

2b) Aplicaciones

3) Bases de datos morfosintácticas y sintácticas-semánticas, y corpus relacionados: EDBL, EPEC, Verbnet/PropBank, Nomlex/Nombank, Framenet...

3a) Cuestiones lingüísticas: entradas, unidades léxicas, unidades morfológicas, roles semánticos, clases semánticos, estructura argumental, entrada lexical

4) Anotación

5)Evaluación corpus: Intercoder Agreement, R básico

Bibliografía

Materiales de uso obligatorio

Material de clase disponible en eGela.

Bibliografía básica

Robert Truswell: The Oxford Hanbook of Event Structure. Oxford University Press. 2019

Daniel Jurafsky, James H. Martin. Speech and Language Processing (2nd Edition). Pearson. 2008.

Bibliografía de profundización

Beth Levin. English Verb Classes and Alternations: A preliminary Investigation. The University of Chicago Press. 1993.

Enlaces

http://adimen.si.ehu.es/cgi-bin/wei/public/wei.consult.perl



https://verbs.colorado.edu/verb-index/



http://ixa2.si.ehu.es/e-rolda/index.php?lang=en



http://ixa2.si.ehu.es/stswiki/



Contenido de XSL

Sugerencias y solicitudes