Gaia
Ikasketa automatikorako sarrera
Gaiari buruzko datu orokorrak
- Modalitatea
- Ikasgelakoa
- Hizkuntza
- Ingelesa
Irakasgaiaren azalpena eta testuingurua
Una introducción a los principios y técnicas estadísticas básicas usadas en el procesamiento del lenguaje natural. Estudiaremos aspectos en el área de la estadística descriptiva. También introduciremos técnicas de aprendizaje automático, incluidos el procesamiento básico de datos y los principales algoritmos de aprendizaje.Irakasleak
Izena | Erakundea | Kategoria | Doktorea | Irakaskuntza-profila | Arloa | Helbide elektronikoa |
---|---|---|---|---|---|---|
ARBELAIZ GALLEGO, OLATZ | Euskal Herriko Unibertsitatea | Irakaslego Osoa | Doktorea | Elebiduna | Konputagailuen Arkitektura eta Teknologia | olatz.arbelaitz@ehu.eus |
PEREZ RAMIREZ, ALICIA | Euskal Herriko Unibertsitatea | Irakaslego Agregatua | Doktorea | Elebiduna | Hizkuntza eta Sistema Informatikoak | alicia.perez@ehu.eus |
SOROA ECHAVE, AITOR | Euskal Herriko Unibertsitatea | Irakaslego Agregatua | Doktorea | Elebiduna | Konputazio Zientzia eta Adimen Artifiziala | a.soroa@ehu.eus |
Gaitasunak
Izena | Pisua |
---|---|
Capacidad de comprender y aplicar las medidas estadísticas básicas para la descripción de características en un conjunto de datos. | 35.0 % |
Capacidad para comprender estrategias de aprendizaje automático en el procesamiento del lenguaje humano. | 25.0 % |
Capacidad de aplicar algoritmos clásicos para la resolución de problemas de PLN. | 40.0 % |
Irakaskuntza motak
Mota | Ikasgelako orduak | Ikasgelaz kanpoko orduak | Orduak guztira |
---|---|---|---|
Magistrala | 10 | 15 | 25 |
Laborategiko p. | 20 | 30 | 50 |
Irakaskuntza motak
Izena | Orduak | Ikasgelako orduen ehunekoa |
---|---|---|
Eskola magistralak | 25.0 | 40 % |
Ordenagailuko praktikak, irteerak, bisitak | 50.0 | 40 % |
Ebaluazio-sistemak
Izena | Gutxieneko ponderazioa | Gehieneko ponderazioa |
---|---|---|
Bertaratzea eta Parte-hartzea | 10.0 % | 10.0 % |
Idatzizko azterketa | 30.0 % | 60.0 % |
Lan praktikoak | 30.0 % | 60.0 % |
Irakasgaia ikastean lortuko diren emaitzak
Extraer las características más importantes de variables estadísticas, como pueden ser medidas de tendencia central, dispersión y correlación, tanto para variables cuantitativas como cualitativas.Conocer el funcionamiento de los algoritmos de clasificación para poder aplicar el más adecuado a cada problema.
Conocer el preprocesamiento adecuado de los datos de entrada para plantear y poder resolver adecuadamente el problema de clasificación.
Aprender a utilizar software específico para la clasificación de tareas de procesamiento de lenguaje natural.
Irakasgai-zerrenda
1. Medidas básicas estadísticas: Mean, Standard deviation, Chi-square, Mutual information, Kappa, etc.2. Introducción al aprendizaje automático para el PLN
3. Algoritmos básicos en aprendizaje automático: Naive Bayes, K-NN, Decision trees, SVM...
4. Evaluación el aprendizaje supervisado
Bibliografia
Oinarrizko bibliografia
R.H. Baayen (2008)Analyzing Linguistic Data. A PracticalIntroduction to Statistics using R. Cambridge University Press
C.D. Manning, H. Sch utze (2003)Foundations of StatisticalNatural Language Processing. The MIT Press
Data Mining. Mark Hall, Ian Witten and Eibe Frank(4th Edition). TheMorgan Kaufmann, 2017.
Machine LearningforText. CharuC. Aggarwal. Springer, 2018
Text Mining with R. Julia Silgeeta David Robinson. O'Relly, 2017
Fundamentals of Predictive Text Mining (2nd Edition). Weiss, SholomM., Indurkhya, Nitin, Zhang, Tong. Springer-VerlagLondon, 2015