Gaia

XSLaren edukia

LNP Aplikazioak (II): Informazioaren Erauzketarako, Galderak Erantzuteko eta Hizketarako Sistemak Eraikitzen

Gaiari buruzko datu orokorrak

Modalitatea
Ikasgelakoa
Hizkuntza
Ingelesa

Irakasgaiaren azalpena eta testuingurua

El objetivo de la asignatura es conocer y obtener la capacidad de implementar aplicaciones basadas en las tecnologías del lenguaje o procesamiento del lenguaje natural. Se estudiaran la aplicaciones básicas de PLN que en la actualidad se utilizan en la industria de la tecnologías del lenguaje.

El contenido se concentrara en las siguientes tareas:

i) Extracción de la información: Presentar técnicas avanzadas para la desambiguación del léxico en varios niveles lingüísticos. Las técnicas desambiguación incluyen algoritmos de desambiguación de sentido de palabras, entity linking, y reconocimiento y clasificación de entidades nombradas (NERC). Conocer e implementar algoritmos de extracción de información estructurada, así como la extracción de relaciones semánticas y extracción de eventos. Para ello, el alumno será capaz de utilizar técnicas avanzadas de Deep Learning (embeddings, transfer learning, LSTM, CNN, etc.), sequence labeling (inferencia, beam search, viterbi, etc.) y supervisión a distancia.

ii) Question Answering: Presentar técnicas no supervisadas (unsupervised learning) basadas en la similitud textual semántica (embeddings, teoria de grafos), y técnicas basadas en algoritmos supervisados que incluyen métodos end-to-end, recuperación de información, y recuperación de conocimiento. También se estudiarán técnicas de generación de lenguaje (p.e. modelos de lenguaje, seq2seq). Se estudiaran los últimos avances en tareas multimodales (e.g. visual question answering)

iii) Sistemas conversacionales: Presentar los módulos que conforman los sistemas conversacionales, y los algoritmos que controlan interacción del dialogo entre humanos y máquina. Se hará especial hincapié en el módulo de comprensión del lenguaje natural (NLU) así como la generación del lenguaje.

Irakasleak

IzenaErakundeaKategoriaDoktoreaIrakaskuntza-profilaArloaHelbide elektronikoa
ALDEZABAL ROTETA, IZASKUNEuskal Herriko UnibertsitateaIrakaslego AgregatuaDoktoreaElebidunaEuskal Filologiaizaskun.aldezabal@ehu.eus
BARRENA MADINABEITIA, ANDEREuskal Herriko UnibertsitateaIrakaslego Atxikia (Laguntzaile Doktorea)DoktoreaElebidunaHizkuntza eta Sistema Informatikoakander.barrena@ehu.eus
GONZALEZ DIOS, ITZIAREuskal Herriko UnibertsitateaIrakaslego AgregatuaDoktoreaElebidunaEuskal Filologiaitziar.gonzalezd@ehu.eus
LARRAÑAGA OLAGARAY, MIGUELEuskal Herriko UnibertsitateaIrakaslego AgregatuaDoktoreaElebidunaHizkuntza eta Sistema Informatikoakmikel.larranaga@ehu.eus
LOPEZ DE LACALLE LECUONA, OIEREuskal Herriko UnibertsitateaIrakaslego Atxikia (Laguntzaile Doktorea)DoktoreaElebidunaHizkuntza eta Sistema Informatikoakoier.lopezdelacalle@ehu.eus

Gaitasunak

IzenaPisua
Conocimiento de las herramientas existentes para el procesamiento de diferentes lenguas (analizadores morfológicos, sintácticos, semánticos).12.0 %
Conocimiento de utilización de las técnicas y recursos de ingeniería lingüística para aplicaciones reales de extracción de información, sistemas preguntas-respuestas, y sistemas conversacionales.12.0 %
Capacidad para comprender estrategias de aprendizaje automático en el procesamiento del lenguaje humano.12.0 %
Habilidad para manejar las estrategias y herramientas basadas en conocimiento para el procesamiento del lenguaje humano.12.0 %
Habilidad para el manejo, adaptación y mejora de los métodos empíricos más relevantes para la investigación en las tecnologías de la lengua.12.0 %
Habilidad para el manejo y adaptación de las herramientas existentes para el procesamiento de diferentes lenguas (analizadores morfológicos, sintácticos, semánticos, etc.).12.0 %
Capacidad para diseñar e implementar aplicaciones lingüísticos reales de extracción de información, preguntas-respuestas, y partes de sistemas conversacionales.28.0 %

Irakaskuntza motak

MotaIkasgelako orduakIkasgelaz kanpoko orduakOrduak guztira
Magistrala1522.537.5
Laborategiko p.304575

Irakaskuntza motak

IzenaOrduakIkasgelako orduen ehunekoa
Eskola magistralak37.540 %
Ordenagailuko praktikak, irteerak, bisitak75.040 %

Ebaluazio-sistemak

IzenaGutxieneko ponderazioaGehieneko ponderazioa
Azalpenak20.0 % 20.0 %
Idatzizko azterketa20.0 % 20.0 %
Lan praktikoak40.0 % 40.0 %
OTROS20.0 % 20.0 %

Irakasgaia ikastean lortuko diren emaitzak

Capacidad de implementar aplicaciones basadas en la tecnologías del lenguaje o procesamiento del lenguaje natural.

Conocimiento de la utilización de herramientas básicas del procesamiento del lenguaje natural.

Capacidad de utilizar y programar aplicaciones que utilizan métodos avanzados como Deep Learning y Machine Learning.

Capacidad de evaluación de aplicaciones NLP.

Ohiko deialdia: orientazioak eta uko egitea

1) 25% of the grading is based on class assignments: these will be typically performed in class hours, and will be handed in using e-gela. The student who hands-in approximately correct solutions to all assignments will be assigned full credit.



2) 75% of the grading is on three projects, each related to main tasks introduced in the course: each student will select or propose a subject for the project to one of the lecturers, depending on his/her interests. If a student does not propose any subject, the lecturers will assign a final project subject to him/her. The final project will be graded based on an oral presentation and written report., with the following percentages:



- write-up 30%, including features like clarity, structure,background, references, discussion

- technical 40%, including features like correctness and depth ofthe work

- presentation 30%, including clarity, structure, discussion

Ezohiko deialdia: orientazioak eta uko egitea

In case the class assignments are missing or clearly deficient, the student will be evaluated depending on the three projects.

Irakasgai-zerrenda

1. Introducción al NLP aplicado

2. Extracción de Información y técnicas de desambiguación.

3. Sistemas de Preguntas-Respuestas.

4. Sistemas conversacionales.

Bibliografia

Oinarrizko bibliografia

Chris Manning and Hinrich Schütze. Foundations of Statistical Natural Language Processing, MIT Press. Cambridge, MA: May 1999.

Daniel Jurafsky, James H. Martin. Speech and Language Processing (2nd Edition), Pearson. May, 2008.

Eneko Agirre, Phillip Edmonds (Eds.). Word Sense Disambiguation: Algorithms and applications, Springer. 2007

Yoav Goldberg, Graeme Hirst. Neural Network Methods in Natural Language Processing (Synthesis Lectures on Human Language Technologies). 2017. Primer. http://u.cs.biu.ac.il/~yogo/nnlp.pdf

ACL: https://aclweb.org/anthology/