Gaia

XSLaren edukia

Datuen Zientziarako Azpiegiturak

Gaiari buruzko datu orokorrak

Modalitatea
Ikasgelakoa
Hizkuntza
Ingelesa

Irakasgaiaren azalpena eta testuingurua

OHARRA: IRAKASGAI HAU INGELESEZ ESKAINTZEN DA SOILIK



Etengabe erregistratzen diren datuen bolumena handitzearekin, nabarmen murriztu da datu-prozesaketa egiteko ordenagailu pertsonalak erabiltzearen bideragarritasuna. Testuinguru horretan, gaur egungo datu-zientzia proiektu orokor baten karga konputazionalaren zatirik astunena konputazio-klusterren esku uzten da. Kluster hauen arkitektura (bai hardwareari bai softwareari dagokienez) erabat alda daiteke, bete behar duten ataza-motaren arabera.





"Datuen Zientziarako Azpiegiturak" ikasgaian, lehenik eta behin, datuen prozesamenduaren paradigmak ikasiko ditugu, kasu bakoitzean dauden desberdintasunak nabarmenduz, eta hauek klusterren diseinuan daukaten eragina.

Irakasleak

IzenaErakundeaKategoriaDoktoreaIrakaskuntza-profilaArloaHelbide elektronikoa
GARCIARENA HUALDE, UNAIEuskal Herriko UnibertsitateaIrakaslego Atxikia (Laguntzaile Doktorea)DoktoreaElebidunaKonputagailuen Arkitektura eta Teknologiaunai.garciarena@ehu.eus
NAVARIDAS PALMA, JAVIEREuskal Herriko UnibertsitateaRamón Y Cajal IkertzaileaDoktoreaElebakarraArloa ez dago adierazita edo behin-behinekoa dajavier.navaridas@ehu.eus

Gaitasunak

IzenaPisua
Que los estudiantes entiendan las necesidades y requisitos de problemas de ciencia de datos correspondiente a diferentes disciplinas científicas, trabajando de forma conjunta con los usuarios.0.0 %
Que los estudiantes sean capaces de ofrecer soluciones técnicas adecuadas y adaptadas a las necesidades asociadas cada problema, documentando adecuadamente dichas soluciones.0.0 %

Irakaskuntza motak

MotaIkasgelako orduakIkasgelaz kanpoko orduakOrduak guztira
Magistrala1522.537.5
Ordenagailuko p.1522.537.5

Irakaskuntza motak

IzenaOrduakIkasgelako orduen ehunekoa
Eskola magistralak15.0100 %
Ikaslearen lan pertsonala45.00 %
Ordenagailuko praktikak15.0100 %

Ebaluazio-sistemak

IzenaGutxieneko ponderazioaGehieneko ponderazioa
Banakako eta/edo taldeko lana, entsegua50.0 % 100.0 %
Idatzizko azterketa0.0 % 50.0 %

Irakasgaia ikastean lortuko diren emaitzak

Ikasgaia egin ondoren, ikasleek honakoak egiteko gai izango dira:

Datacenter arkitektura desberdinen arteko desberdintasunak, eta horiek betetzen dituzten betekizunak ulertzea: HPC, Datuen prozesamendua, Datuen biltegiratzea.

Hardware-arkitektura horietarako dauden software-aukerak ezagutu, eta horien ezaugarriak bete beharreko atazekin nola erlazionatzen diren ulertzea.

Arkitektura horiek inplementatzea.



Ohiko deialdia: orientazioak eta uko egitea

The evaluation will consist of two parts, a written exam and a set of practical works. The exam (50% of the final mark) will cover the theoretical concepts seen in class, whereas the practical part (remaining 50% of the final mark, divided into multiple works) will consist of implementing the software architectures in virtual environments.

Ezohiko deialdia: orientazioak eta uko egitea

Ebaluazioak bi zati izanen ditu, idatzizko azterketa bat eta lan praktiko multzo bat. Azterketak (nota finalaren %50) klasean ikusitako kontzeptu teorikoak ebaluatuko ditu; zati praktikoan (nota finalaren %50, hainbat lanetan banatua), berriz, ingurune birtualetan software-arkitekturak inplementatuko ditugu.

Irakasgai-zerrenda

1. Prozesatze-azpiegiturak

1. Hodeia

2. Sarea

3. Datacenter-ak

2. Zerbitzu-orkestrazioa

1. Birtualizazioa

3. Prozesatze-arkitekturak

1. Errendimendu handiko informatika

2. Big data

4. Big data prozesatzeko plataformak

1. Batch

2. Streaming eta IoT

Bibliografia

Nahitaez erabili beharreko materiala

Beharrezkoa ez izan arren, gomendagarria da gai honetan proposatzen diren jarduerak garatzeko birtualizazio-lanak egiteko adinako ahalmena duen eramangarri pertsonala izatea.







Oinarrizko bibliografia

Tom White. Hadoop: The Definitive Guide: Storage and Analysis at Internet Scale. 2015.

Ben Sharma. Architecting Data Lakes, 2nd Edition. 2018.

Neha Narkhede et al. "Kafka" The Definitive Guide: Real-time data and stream processing at scale. 2017.

Jan Kunigk et al. Architecting Modern Data Platforms: A Guide to Enterprise Hadoop at Scale. 2019.

Sam Alapati. Expert Hadoop Administration: Managing, Tuning, and Securing Spark, YARN, and HDFS. 2017.

Aldizkariak

Journal of Big Data (Springer)



Big data research (Elsevier)

XSLaren edukia

Iradokizunak eta eskaerak