Gaia

XSLaren edukia

Ikasketa Automatikoa (II)

Gaiari buruzko datu orokorrak

Modalitatea
Ikasgelakoa
Hizkuntza
Ingelesa

Irakasgaiaren azalpena eta testuingurua

El curso pone el foco en un conjunto de t¿icas inspiradas en la inteligencia artificial y la estad¿ica. En la ¿ltima d¿da, estos campos han experimentado un crecimiento notable, particularmente relacionado con el an¿sis de grandes cantidades de datos mediante t¿icas y algoritmos de base matem¿ca, estad¿ica y de optimizaci¿eur¿ica. La aplicaci¿e t¿icas de aprendizaje autom¿co est¿mpliamente expandido en ¿as como la bioinform¿ca, finanzas, y tambi¿el procesamiento de textos.

El alumnado estudiar¿as principales t¿icas para la miner¿de datos, y aumentar¿us habilidades en usos de populares herramientas de software que implementan estas t¿icas. Todo ello mediante la demostraci¿obre aplicaciones reales de procesamiento de texto.

Irakasleak

IzenaErakundeaKategoriaDoktoreaIrakaskuntza-profilaArloaHelbide elektronikoa
INZA CANO, IÑAKIEuskal Herriko UnibertsitateaIrakaslego OsoaDoktoreaElebidunaKonputazio Zientzia eta Adimen Artifizialainaki.inza@ehu.eus

Gaitasunak

IzenaPisua
Habilidad para manejar las estrategias y herramientas basadas en conocimiento para el procesamiento del lenguaje humano.30.0 %
Habilidad para el manejo y la adaptación de los métodos simbólicos y basados en corpus (aprendizaje automático) más relevantes para la investigación en las tecnologías de la lengua.70.0 %

Irakaskuntza motak

MotaIkasgelako orduakIkasgelaz kanpoko orduakOrduak guztira
Magistrala101525
Ordenagailuko p.203050

Irakasgaia ikastean lortuko diren emaitzak

Conocimiento de los principales escenarios de aprendizaje autom¿co.

Identificar el tipo de t¿ica a aplicar en cada escenario de clasificaci¿Conocer los pasos b¿cos, standard, de un pipeline-flujo de an¿sis de datos,

Uso de librer¿ de R-project para la creaci¿e un corpus y su "document-term matrix" asociada, y la posterior aplicaci¿e t¿icas de aprendizaje autom¿co sobre ella.

Irakasgai-zerrenda



1- "Data science" munduari sarrera: Adimen Artifiziala eta datu analisia.



2- Datu analisia: ikasketa gainbegiratu, gainbegiratu gabea, weakly-supervised classification. Bakoitzerako: datu matrizearen estruktura, etiketen egitura, aplikazio errealak.



3- One-class classification and outlier detection. Outlier dokumentoen detekzio. Erabilgarritasuna NLPs. Software: R packages.



4- Sailkapen semi-gainbegiratua. Nola ikasi modeloak etiketatu gabeko dokumentoak erabiliz. Erabilgarritasuna NLPs. Software: R-RSSL package.



5- Test estatistikoen erabilgarritasuna modeloak konparatzeko. Software: R, web orrialdeak.



6- Aldagaien aukeraketa (baldin denbora).



7- Preprozesorako teknika orokorrak: datu galduak, one-hot-encoding, diskretizazioa, klaseen ekilibrio falta... (baldin denbora).



8- "A short introduction to the tm (text mining) package in R: text processing". Nola ikasi corpus bat text-mining operadoreak erabiliz. Html, fitxategi, edo twitter-etik hasiz. Tutoriala, R.



9- "The machine learning approach: clustering words and classifying documents with R". Tutoriala R-caret paketearekin.



10- "First steps on deep learning for NLP by R’s h2o package (+word2vec)". Tutoriala R-rekin. Bolondres lana.

Bibliografia

Oinarrizko bibliografia

*M. Kuhn, K. Johnson (2013). Applied Predictive Modeling. Springer.

*ParallelDots, online text analysis APIs for several tasks: sentiment analysis, tags' prediction, keyword generator, entity extraction, comparing similarity of texts, different emotions analysis, intent analysis, abusive text prediction, etc. https://www.paralleldots.com/text-analysis-apis

* sentiment140: an interesting project for automatic sentiment categorization of tweets: http://help.sentiment140.com/

* Stanford TreeBank project. "Recursive deep models for semantic compositionality over a semantic treebank". https://nlp.stanford.edu/sentiment/

* RDataMining website: Text mining with R: Twitter data analysis: http://www.rdatamining.com/docs/text-mining-with-r

* Awesome sentiment analysis: A curated list of Sentiment Analysis methods, implementations and misc. https://github.com/xiamx/awesome-sentiment-analysis

* "5 things you need to know about sentiment analysis and classification": https://www.kdnuggets.com/2018/03/5-things-sentiment-analysis-classification.html

* Bing Liu's website on "Opinion mining, sentiment analysis and opinion spam detection: the machine learning approach". https://www.cs.uic.edu/~liub/FBS/sentiment-analysis.html

* 18 NLP key terms, explained for ML practitioners and NLP novices: https://www.kdnuggets.com/2017/02/natural-language-processing-key-terms-explained.html

XSLaren edukia

Ezin izan da edukia sortu, beranduago saiatu. Arazoak aurrera jarraitzen badu, jarri harremanetan CAUrekin (Tlf: 946014400 / Email: cau@ehu.eus / Web: https://lagun.ehu.eus).