Gaia

XSLaren edukia

Ikasketa automatikorako sarrera

Gaiari buruzko datu orokorrak

Modalitatea
Ikasgelakoa
Hizkuntza
Ingelesa

Irakasgaiaren azalpena eta testuingurua

Una introducción a los principios y técnicas estadísticas básicas usadas en el procesamiento del lenguaje natural. Estudiaremos aspectos en el área de la estadística descriptiva. También introduciremos técnicas de aprendizaje automático, incluidos el procesamiento básico de datos y los principales algoritmos de aprendizaje.

Irakasleak

IzenaErakundeaKategoriaDoktoreaIrakaskuntza-profilaArloaHelbide elektronikoa
ARBELAIZ GALLEGO, OLATZEuskal Herriko UnibertsitateaIrakaslego AgregatuaDoktoreaElebidunaKonputagailuen Arkitektura eta Teknologiaolatz.arbelaitz@ehu.eus
PEREZ RAMIREZ, ALICIAEuskal Herriko UnibertsitateaIrakaslego AgregatuaDoktoreaElebidunaHizkuntza eta Sistema Informatikoakalicia.perez@ehu.eus
SOROA ECHAVE, AITOREuskal Herriko UnibertsitateaIrakaslego AgregatuaDoktoreaElebidunaKonputazio Zientzia eta Adimen Artifizialaa.soroa@ehu.eus

Gaitasunak

IzenaPisua
Capacidad de comprender y aplicar las medidas estadísticas básicas para la descripción de características en un conjunto de datos.35.0 %
Capacidad para comprender estrategias de aprendizaje automático en el procesamiento del lenguaje humano.25.0 %
Capacidad de aplicar algoritmos clásicos para la resolución de problemas de PLN.40.0 %

Irakaskuntza motak

MotaIkasgelako orduakIkasgelaz kanpoko orduakOrduak guztira
Magistrala101525
Laborategiko p.203050

Irakaskuntza motak

IzenaOrduakIkasgelako orduen ehunekoa
Eskola magistralak25.040 %
Ordenagailuko praktikak, irteerak, bisitak50.040 %

Ebaluazio-sistemak

IzenaGutxieneko ponderazioaGehieneko ponderazioa
Bertaratzea eta Parte-hartzea10.0 % 10.0 %
Idatzizko azterketa30.0 % 60.0 %
Lan praktikoak30.0 % 60.0 %

Irakasgaia ikastean lortuko diren emaitzak

Extraer las características más importantes de variables estadísticas, como pueden ser medidas de tendencia central, dispersión y correlación, tanto para variables cuantitativas como cualitativas.

Conocer el funcionamiento de los algoritmos de clasificación para poder aplicar el más adecuado a cada problema.

Conocer el preprocesamiento adecuado de los datos de entrada para plantear y poder resolver adecuadamente el problema de clasificación.

Aprender a utilizar software específico para la clasificación de tareas de procesamiento de lenguaje natural.

Irakasgai-zerrenda

1. Medidas básicas estadísticas: Mean, Standard deviation, Chi-square, Mutual information, Kappa, etc.

2. Introducción al aprendizaje automático para el PLN

3. Algoritmos básicos en aprendizaje automático: Naive Bayes, K-NN, Decision trees, SVM...

4. Evaluación el aprendizaje supervisado

Bibliografia

Oinarrizko bibliografia



R.H. Baayen (2008)Analyzing Linguistic Data. A PracticalIntroduction to Statistics using R. Cambridge University Press

C.D. Manning, H. Sch utze (2003)Foundations of StatisticalNatural Language Processing. The MIT Press

Data Mining. Mark Hall, Ian Witten and Eibe Frank(4th Edition). TheMorgan Kaufmann, 2017.

Machine LearningforText. CharuC. Aggarwal. Springer, 2018

Text Mining with R. Julia Silgeeta David Robinson. O'Relly, 2017

Fundamentals of Predictive Text Mining (2nd Edition). Weiss, SholomM., Indurkhya, Nitin, Zhang, Tong. Springer-VerlagLondon, 2015