Gaia

XSLaren edukia

Sintaxi Konputazionala

Gaiari buruzko datu orokorrak

Modalitatea
Ikasgelakoa
Hizkuntza
Ingelesa

Irakasgaiaren azalpena eta testuingurua

Este curso presentará los principales enfoques para el tratamiento computacional de la sintaxis. Entre otros, gramáticas sin contexto, sintaxis de estado finito y modelos estadísticos. Se presentarán varios formalismos, como las gramáticas independientes del contexto, gramáticas probabilísticas, gramáticas de unificación, y la gramática de restricciones. También presentaremos una descripción general principal de etiquetado morfosintáctico (Part of Speech tagging), reconocimiento parcial (chunking) y análisis sintáctico de constituyentes y de dependencias (parsing).

Se dará una descripción general del papel que desempeñan la morfología y la sintaxis en las aplicaciones que utilizan la tecnología del lenguaje.

Irakasleak

IzenaErakundeaKategoriaDoktoreaIrakaskuntza-profilaArloaHelbide elektronikoa
GOJENOLA GALLETEBEITIA, KOLDOBIKAEuskal Herriko UnibertsitateaUnibertsitateko Irakaslego TitularraDoktoreaElebidunaHizkuntza eta Sistema Informatikoakkoldo.gojenola@ehu.eus
ORONOZ ANCHORDOQUI, MAITEEuskal Herriko UnibertsitateaIrakaslego AgregatuaDoktoreaElebidunaHizkuntza eta Sistema Informatikoakmaite.oronoz@ehu.eus
URIZAR ENBEITA, RUBENEuskal Herriko UnibertsitateaUnibertsitateko Irakaslego TitularraDoktoreaElebidunaHizkuntzaren eta Literaturaren Didaktikaruben.urizar@ehu.eus
MANS , HULDENUniversity of Colorado, BoulderBesteakDoktorea

Gaitasunak

IzenaPisua
Capacidad para manejar, enriquecer y utilizar recursos lingüísticos para el procesamiento del lenguaje humano.20.0 %
Comprensión de las estrategias básicas para el análisis del lenguaje y la capacidad de extender estas estrategias para su uso en aplicaciones para el procesamiento del lenguaje.20.0 %
Capacidad para usar y adaptar las herramientas (analizadores morfológicos, sintácticos y semánticos) disponibles para diferentes idiomas.20.0 %
Capacidad para diseñar y desarrollar recursos, herramientas y aplicaciones informáticas para tecnologías del lenguaje.20.0 %
Capacidad para usar y adaptar los métodos relevantes para la investigación en tecnologías del lenguaje.20.0 %

Irakaskuntza motak

MotaIkasgelako orduakIkasgelaz kanpoko orduakOrduak guztira
Magistrala1522.537.5
Laborategiko p.304575

Irakaskuntza motak

IzenaOrduakIkasgelako orduen ehunekoa
Eskola magistralak37.540 %
Ordenagailuko praktikak, irteerak, bisitak75.040 %

Ebaluazio-sistemak

IzenaGutxieneko ponderazioaGehieneko ponderazioa
Bertaratzea eta Parte-hartzea5.0 % 5.0 %
Idatzizko azterketa20.0 % 20.0 %
Txostenak eta azalpenak lantzea75.0 % 75.0 %

Irakasgaia ikastean lortuko diren emaitzak

Conocer los elementos básicos de la sintaxis computacional: (a) gramáticas independientes del contexto, (b) gramáticas probabilísticas, (c) gramáticas de unificación, (d) sintaxis basada en constituyentes y (e) sintaxis de dependencias.

Aprender a escribir código y utilizar librerías para el desarrollo de analizadores sintácticos en PLN.

Implementación de tareas específicas de análisis sintáctico computacional con autonomía.

Irakasgai-zerrenda

1.Introducción a la Sintaxis Computacional



2. Sintaxis de estado finito

2.1. Asignación de categorías sintácticas (POS tagging)

Basada en el conocimiento (Constraint Grammar)

Basada en datos (métodos estadísticos)

2.2. Chunking



3. Expresiones multipalabra (MWE)



4. Gramáticas independientes del contexto

4.1. Modelo básico

4.2. Gramáticas independientes del contexto probabilísticas

4.3. Gramáticas basadas en unificación



5. Sintaxis de dependencias

5.1. Basada en reglas

5.2. Basada en datos

Bibliografia

Oinarrizko bibliografia

Brian Roark and Richard Sproat. 2007. Computational Approaches to Morphology and Syntax. Oxford University Press

D. Jurafsky, James H. Martin. Speech and Language Processing (Second Edition), Prentice Hall, Upper Saddle River, N.J. , 2008.

C. Manning, H. Schütze (1999) Foundations of Statistical Natural Language Processing, MIT Press Cambridge, Mass., 1999.

Bemova A., Hajic J., Hladka B. eta Panevova J. (1999). Morphological and Syntactic Tagging of the Prague Dependency Treebank. Journées Atala, Corpus annotés pour la syntaxe. Paris, France.

Bick, E. (2000). The Parsing System "Palavras": Automatic Grammatical Analysis of Portuguese in a Constraint Grammar Framework, Aarhus University Press, Aarhus.

Basic Constrint Grammar Tutorial for CG-3 (Vislcg3) http://beta.visl.sdu.dk/cg3_howto.pdf

Bird S., Ewan Klein, and Edward Loper. Natural Language Processing with Python --- Analyzing Text with the Natural Language Toolkit (2009). O'Reilly Media. http://www.nltk.org/book/

Chomsky, N. (1957). Syntactic structures. The Hague: Mouton.

Karlsson F., Voutilainen A., Heikkilä J. eta Anttila A. (1995). Constraint Grammar: A Language-independent System for Parsing Unrestricted Text. Mouton de Gruyter, Berlin.

R Socher, J Bauer, CD Manning. Parsing with compositional vector grammars Proceedings of the 51st Annual Meeting of the Association for Computational Linguistics 2013

Gehiago sakontzeko bibliografia





• Chomsky, N. (1957). Syntactic structures. The Hague: Mouton.







• R Socher, J Bauer, CD Manning. Parsing with compositional vector grammars Proceedings of the 51st Annual Meeting of the Association for Computational Linguistics 2013







• Association for Computational Linguistics (ACL) Anthology: