Gaia

XSLaren edukia

Ikasketa Automatikoa (II)

Gaiari buruzko datu orokorrak

Modalitatea
Ikasgelakoa
Hizkuntza
Ingelesa

Irakasgaiaren azalpena eta testuingurua

El curso pone el foco en un conjunto de t¿icas inspiradas en la inteligencia artificial y la estad¿ica. En la ¿ltima d¿da, estos campos han experimentado un crecimiento notable, particularmente relacionado con el an¿sis de grandes cantidades de datos mediante t¿icas y algoritmos de base matem¿ca, estad¿ica y de optimizaci¿eur¿ica. La aplicaci¿e t¿icas de aprendizaje autom¿co est¿mpliamente expandido en ¿as como la bioinform¿ca, finanzas, y tambi¿el procesamiento de textos.

El alumnado estudiar¿as principales t¿icas para la miner¿de datos, y aumentar¿us habilidades en usos de populares herramientas de software que implementan estas t¿icas. Todo ello mediante la demostraci¿obre aplicaciones reales de procesamiento de texto.

Irakasleak

IzenaErakundeaKategoriaDoktoreaIrakaskuntza-profilaArloaHelbide elektronikoa
INZA CANO, IÑAKIEuskal Herriko UnibertsitateaIrakaslego AgregatuaDoktoreaElebidunaKonputazio Zientzia eta Adimen Artifizialainaki.inza@ehu.eus

Gaitasunak

IzenaPisua
Habilidad para manejar las estrategias y herramientas basadas en conocimiento para el procesamiento del lenguaje humano.30.0 %
Habilidad para el manejo y la adaptación de los métodos simbólicos y basados en corpus (aprendizaje automático) más relevantes para la investigación en las tecnologías de la lengua.70.0 %

Irakaskuntza motak

MotaIkasgelako orduakIkasgelaz kanpoko orduakOrduak guztira
Magistrala101525
Ordenagailuko p.203050

Irakasgaia ikastean lortuko diren emaitzak

Conocimiento de los principales escenarios de aprendizaje autom¿co.

Identificar el tipo de t¿ica a aplicar en cada escenario de clasificaci¿Conocer los pasos b¿cos, standard, de un pipeline-flujo de an¿sis de datos,

Uso de librer¿ de R-project para la creaci¿e un corpus y su "document-term matrix" asociada, y la posterior aplicaci¿e t¿icas de aprendizaje autom¿co sobre ella.

Irakasgai-zerrenda

1. Principales escenarios de clasificaci¿Formalismos y aplicaciones en cada escenario: clasificaci¿upervisada, clustering, "weakly supervised classification" ('positive unlabeled learning', 'learning from label proportions', 'partial labels', etc.)

2. T¿icas y filtros generales para el preprocesamiento de datos. Software: WEKA

3. Principales t¿icas para la selecci¿e variables. Software: WEKA

4. Validaci¿e modelos de clasificaci¿Uso de tests estad¿icos para la comparativa entre clasificadores. Software: WEKA, R, recursos web

5. El paquete 'tm'(text-mining) del software R. Construcci¿ediante operadores de 'text-mining' una 'document-term' matrix para su posterior an¿sis mediante t¿icas de aprendizaje autom¿co. Notebook-tutorial

6. 'The machine learning approach': clustering de t¿inos y clasificaci¿e documentos. Uso del paquete "caret" de R. Notebook-tutorial

7. Primeros pasos en "deep learning" para la clasificaci¿e documentos. Uso del paquete 'h2o' de R. Notebook-tutorial

Bibliografia

Oinarrizko bibliografia

*M. Kuhn, K. Johnson (2013). Applied Predictive Modeling. Springer.

*ParallelDots, online text analysis APIs for several tasks: sentiment analysis, tags' prediction, keyword generator, entity extraction, comparing similarity of texts, different emotions analysis, intent analysis, abusive text prediction, etc. https://www.paralleldots.com/text-analysis-apis

* sentiment140: an interesting project for automatic sentiment categorization of tweets: http://help.sentiment140.com/

* Stanford TreeBank project. "Recursive deep models for semantic compositionality over a semantic treebank". https://nlp.stanford.edu/sentiment/

* RDataMining website: Text mining with R: Twitter data analysis: http://www.rdatamining.com/docs/text-mining-with-r

* Awesome sentiment analysis: A curated list of Sentiment Analysis methods, implementations and misc. https://github.com/xiamx/awesome-sentiment-analysis

* "5 things you need to know about sentiment analysis and classification": https://www.kdnuggets.com/2018/03/5-things-sentiment-analysis-classification.html

* Bing Liu's website on "Opinion mining, sentiment analysis and opinion spam detection: the machine learning approach". https://www.cs.uic.edu/~liub/FBS/sentiment-analysis.html

* 18 NLP key terms, explained for ML practitioners and NLP novices: https://www.kdnuggets.com/2017/02/natural-language-processing-key-terms-explained.html

XSLaren edukia

Ezin izan da edukia sortu, beranduago saiatu. Arazoak aurrera jarraitzen badu, jarri harremanetan CAUrekin (Tlf: 946014400 / Email: cau@ehu.eus / Web: https://lagun.ehu.eus).