Materia
Creando Recursos Lingüísticos
Datos generales de la materia
- Modalidad
- Presencial
- Idioma
- Inglés
Descripción y contextualización de la asignatura
El objetivo principal de esta asignatura es demostrar la importancia de poseer recursos lingüísticos (base de datos, bases de conocimiento, corpus anotados a diferentes niveles) bien diseñados (con criterios adecuados), para luego poder aprender de ellos automáticamente, realimentarlos con la nueva información obtenida, y evaluarlos cuantitativa y cualitativamente. Paralelamente, se hace hincapié en la problemática encontrada al tratar las equivalencias interlingüísticas. Todo ello con un planteamiento práctico.Profesorado
Nombre | Institución | Categoría | Doctor/a | Perfil docente | Área | |
---|---|---|---|---|---|---|
ALDEZABAL ROTETA, IZASKUN | Universidad del País Vasco/Euskal Herriko Unibertsitatea | Profesorado Agregado | Doctora | Bilingüe | Filología Vasca | izaskun.aldezabal@ehu.eus |
BARRENA MADINABEITIA, ANDER | Universidad del País Vasco/Euskal Herriko Unibertsitatea | Profesorado Adjunto (Ayudante Doctor/A) | Doctor | Bilingüe | Lenguajes y Sistemas Informáticos | ander.barrena@ehu.eus |
GONZALEZ DIOS, ITZIAR | Universidad del País Vasco/Euskal Herriko Unibertsitatea | Profesorado Agregado | Doctora | Bilingüe | Filología Vasca | itziar.gonzalezd@ehu.eus |
LARRAÑAGA OLAGARAY, MIGUEL | Universidad del País Vasco/Euskal Herriko Unibertsitatea | Profesorado Agregado | Doctor | Bilingüe | Lenguajes y Sistemas Informáticos | mikel.larranaga@ehu.eus |
LOPEZ DE LACALLE LECUONA, OIER | Universidad del País Vasco/Euskal Herriko Unibertsitatea | Profesorado Adjunto (Ayudante Doctor/A) | Doctor | Bilingüe | Lenguajes y Sistemas Informáticos | oier.lopezdelacalle@ehu.eus |
Competencias
Denominación | Peso |
---|---|
Conocimiento de las herramientas existentes para el procesamiento de diferentes lenguas (analizadores morfológicos, sintácticos, semánticos). | 20.0 % |
Conocimiento de los recursos lingüísticos masivos existentes para diferentes lenguas. | 20.0 % |
Capacidad para comprender estrategias de aprendizaje automático en el procesamiento del lenguaje humano. | 20.0 % |
Habilidad para manejar las estrategias y herramientas basadas en conocimiento para el procesamiento del lenguaje humano. | 20.0 % |
Habilidad para el manejo y adaptación de las herramientas existentes para el procesamiento de diferentes lenguas (analizadores morfológicos, sintácticos, semánticos...). | 20.0 % |
Tipos de docencia
Tipo | Horas presenciales | Horas no presenciales | Horas totales |
---|---|---|---|
Magistral | 10 | 15 | 25 |
P. Laboratorio | 20 | 30 | 50 |
Actividades formativas
Denominación | Horas | Porcentaje de presencialidad |
---|---|---|
Clases magistrales | 25.0 | 40 % |
Prácticas con ordenador, laboratorio, salidas de campo, visitas externas | 50.0 | 40 % |
Sistemas de evaluación
Denominación | Ponderación mínima | Ponderación máxima |
---|---|---|
Realización y presentación de trabajos e informes | 50.0 % | 50.0 % |
Trabajos Prácticos | 50.0 % | 50.0 % |
Resultados del aprendizaje de la asignatura
Conocimiento y manejo de recursos que son referencia en el ámbito de la semántica computacional, sobretodo en inglés, pero también en otras lenguas.Conocimiento y manejo de sistemas de evaluación de corpus.
Asimilación de conceptos necesarios en el ámbito de la semántica computacional: lingüística de corpus, clases semánticas, acepción, variante, jerarquía y equivalencia conceptual (hiperonímia/hiponimia, sinonimia), relaciones semánticas, desambiguación semántica, métodos de evaluación.
Criterios lingüísticos a la hora de diseñar y construir recursos lingüísticos.
Convocatoria ordinaria: orientaciones y renuncia
Ordinary call:- Class assignments (50%): exercises, notes, case analysis...
- Project (50%): research project on a topic discussed in class
Convocatoria extraordinaria: orientaciones y renuncia
Extraordinary call:- Final exam (100%) with theoretical and practical tests
Temario
1. Bases de conocimiento y corpus relacionados: wordnets, MCR, SemCor, SUMOa. Cuestiones lingüísticas: gaps conceptuales, conceptos culturales
b. Aplicaciones: resumen y simplificación
2. Bases de datos sintáctico-semánticos y corpus relacionados: Verbnet/PropBank, Nomlex/Nombank, Framenet
a. Cuestiones lingüísticas: roles semánticos, clases semánticas, estructura argumental, entrada léxica
3. Anotación:
a. Similaridad en palabras (WS), en oraciones (STS)
i. Cuestiones lingüísticas: antonimia, similaridad
b. Sentimientos
i. Cuestiones lingüísticas: sentimientos, polaridad
4. Evaluación de corpus: InTercoder Agreement, R básico
Bibliografía
Materiales de uso obligatorio
Material de clase disponible en eGela.Bibliografía básica
Robert Truswell: The Oxford Hanbook of Event Structure. Oxford University Press. 2019Daniel Jurafsky, James H. Martin. Speech and Language Processing (2nd Edition). Pearson. 2008.
Bibliografía de profundización
Beth Levin. English Verb Classes and Alternations: A preliminary Investigation. The University of Chicago Press. 1993.Enlaces
http://adimen.si.ehu.es/cgi-bin/wei/public/wei.consult.perlhttps://verbs.colorado.edu/verb-index/
http://ixa2.si.ehu.es/e-rolda/index.php?lang=en
http://ixa2.si.ehu.es/stswiki/