Materia

Contenido de XSL

Creando Recursos Lingüísticos

Datos generales de la materia

Modalidad
Presencial
Idioma
Inglés

Descripción y contextualización de la asignatura

El objetivo principal de esta asignatura es demostrar la importancia de poseer recursos lingüísticos (base de datos, bases de conocimiento, corpus anotados a diferentes niveles) bien diseñados (con criterios adecuados), para luego poder aprender de ellos automáticamente, realimentarlos con la nueva información obtenida, y evaluarlos cuantitativa y cualitativamente. Paralelamente, se hace hincapié en la problemática encontrada al tratar las equivalencias interlingüísticas. Todo ello con un planteamiento práctico.

Profesorado

NombreInstituciónCategoríaDoctor/aPerfil docenteÁreaEmail
ALDEZABAL ROTETA, IZASKUNUniversidad del País Vasco/Euskal Herriko UnibertsitateaProfesorado AgregadoDoctoraBilingüeFilología Vascaizaskun.aldezabal@ehu.eus
GONZALEZ DIOS, ITZIARUniversidad del País Vasco/Euskal Herriko UnibertsitateaProfesorado AgregadoDoctoraBilingüeFilología Vascaitziar.gonzalezd@ehu.eus

Competencias

DenominaciónPeso
Conocimiento de las herramientas existentes para el procesamiento de diferentes lenguas (analizadores morfológicos, sintácticos, semánticos).20.0 %
Conocimiento de los recursos lingüísticos masivos existentes para diferentes lenguas.20.0 %
Capacidad para comprender estrategias de aprendizaje automático en el procesamiento del lenguaje humano.20.0 %
Habilidad para manejar las estrategias y herramientas basadas en conocimiento para el procesamiento del lenguaje humano.20.0 %
Habilidad para el manejo y adaptación de las herramientas existentes para el procesamiento de diferentes lenguas (analizadores morfológicos, sintácticos, semánticos...).20.0 %

Tipos de docencia

TipoHoras presencialesHoras no presencialesHoras totales
Magistral101525
P. Ordenador203050

Actividades formativas

DenominaciónHorasPorcentaje de presencialidad
Clases magistrales25.040 %
Prácticas con ordenador, laboratorio, salidas de campo, visitas externas50.040 %

Sistemas de evaluación

DenominaciónPonderación mínimaPonderación máxima
Realización y presentación de trabajos e informes50.0 % 50.0 %
Trabajos Prácticos50.0 % 50.0 %

Resultados del aprendizaje de la asignatura

Conocimiento y manejo de recursos que son referencia en el ámbito de la semántica computacional, sobretodo en inglés, pero también en otras lenguas.

Conocimiento y manejo de sistemas de evaluación de corpus.

Asimilación de conceptos necesarios en el ámbito de la semántica computacional: lingüística de corpus, clases semánticas, acepción, variante, jerarquía y equivalencia conceptual (hiperonímia/hiponimia, sinonimia), relaciones semánticas, desambiguación semántica, métodos de evaluación.

Criterios lingüísticos a la hora de diseñar y construir recursos lingüísticos.

Convocatoria ordinaria: orientaciones y renuncia

Ordinary call:



- Class assignments (50%): exercises, notes, case analysis...



- Project (50%): research project on a topic discussed in class

Convocatoria extraordinaria: orientaciones y renuncia

Extraordinary call:



- Final exam (100%) with theoretical and practical tests

Temario

1. Bases de conocimiento y corpus relacionados: wordnets, MCR, SemCor, SUMO

a. Cuestiones lingüísticas: gaps conceptuales, conceptos culturales

b. Aplicaciones: resumen y simplificación



2. Bases de datos sintáctico-semánticos y corpus relacionados: Verbnet/PropBank, Nomlex/Nombank, Framenet

a. Cuestiones lingüísticas: roles semánticos, clases semánticas, estructura argumental, entrada léxica



3. Anotación:

a. Similaridad en palabras (WS), en oraciones (STS)

i. Cuestiones lingüísticas: antonimia, similaridad

b. Sentimientos

i. Cuestiones lingüísticas: sentimientos, polaridad



4. Evaluación de corpus: InTercoder Agreement, R básico

Bibliografía

Materiales de uso obligatorio

Material de clase disponible en eGela.

Bibliografía básica

Robert Truswell: The Oxford Hanbook of Event Structure. Oxford University Press. 2019

Daniel Jurafsky, James H. Martin. Speech and Language Processing (2nd Edition). Pearson. 2008.

Bibliografía de profundización

Beth Levin. English Verb Classes and Alternations: A preliminary Investigation. The University of Chicago Press. 1993.

Enlaces

http://adimen.si.ehu.es/cgi-bin/wei/public/wei.consult.perl

https://verbs.colorado.edu/verb-index/

http://ixa2.si.ehu.es/e-rolda/index.php?lang=en

http://ixa2.si.ehu.es/stswiki/