Gaia
Datuen Zientziarako Azpiegiturak
Gaiari buruzko datu orokorrak
- Modalitatea
- Ikasgelakoa
- Hizkuntza
- Ingelesa
Irakasgaiaren azalpena eta testuingurua
OHARRA: IRAKASGAI HAU INGELESEZ ESKAINTZEN DA SOILIKEtengabe erregistratzen diren datuen bolumena handitzearekin, nabarmen murriztu da datu-prozesaketa egiteko ordenagailu pertsonalak erabiltzearen bideragarritasuna. Testuinguru horretan, gaur egungo datu-zientzia proiektu orokor baten karga konputazionalaren zatirik astunena konputazio-klusterren esku uzten da. Kluster hauen arkitektura (bai hardwareari bai softwareari dagokienez) erabat alda daiteke, bete behar duten ataza-motaren arabera.
"Datuen Zientziarako Azpiegiturak" ikasgaian, lehenik eta behin, datuen prozesamenduaren paradigmak ikasiko ditugu, kasu bakoitzean dauden desberdintasunak nabarmenduz, eta hauek klusterren diseinuan daukaten eragina.
Irakasleak
| Izena | Erakundea | Kategoria | Doktorea | Irakaskuntza-profila | Arloa | Helbide elektronikoa |
|---|---|---|---|---|---|---|
| GARCIARENA HUALDE, UNAI | Euskal Herriko Unibertsitatea | Irakaslego Atxikia (Laguntzaile Doktorea) | Doktorea | Elebiduna | Konputagailuen Arkitektura eta Teknologia | unai.garciarena@ehu.eus |
| NAVARIDAS PALMA, JAVIER | Euskal Herriko Unibertsitatea | Ramón Y Cajal Ikertzailea | Doktorea | Elebakarra | Arloa ez dago adierazita edo behin-behinekoa da | javier.navaridas@ehu.eus |
Gaitasunak
| Izena | Pisua |
|---|---|
| Que los estudiantes entiendan las necesidades y requisitos de problemas de ciencia de datos correspondiente a diferentes disciplinas científicas, trabajando de forma conjunta con los usuarios. | 0.0 % |
| Que los estudiantes sean capaces de ofrecer soluciones técnicas adecuadas y adaptadas a las necesidades asociadas cada problema, documentando adecuadamente dichas soluciones. | 0.0 % |
Irakaskuntza motak
| Mota | Ikasgelako orduak | Ikasgelaz kanpoko orduak | Orduak guztira |
|---|---|---|---|
| Magistrala | 15 | 22.5 | 37.5 |
| Ordenagailuko p. | 15 | 22.5 | 37.5 |
Irakaskuntza motak
| Izena | Orduak | Ikasgelako orduen ehunekoa |
|---|---|---|
| Eskola magistralak | 15.0 | 100 % |
| Ikaslearen lan pertsonala | 45.0 | 0 % |
| Ordenagailuko praktikak | 15.0 | 100 % |
Ebaluazio-sistemak
| Izena | Gutxieneko ponderazioa | Gehieneko ponderazioa |
|---|---|---|
| Banakako eta/edo taldeko lana, entsegua | 50.0 % | 100.0 % |
| Idatzizko azterketa | 0.0 % | 50.0 % |
Irakasgaia ikastean lortuko diren emaitzak
Ikasgaia egin ondoren, ikasleek honakoak egiteko gai izango dira:Datacenter arkitektura desberdinen arteko desberdintasunak, eta horiek betetzen dituzten betekizunak ulertzea: HPC, Datuen prozesamendua, Datuen biltegiratzea.
Hardware-arkitektura horietarako dauden software-aukerak ezagutu, eta horien ezaugarriak bete beharreko atazekin nola erlazionatzen diren ulertzea.
Arkitektura horiek inplementatzea.
Ohiko deialdia: orientazioak eta uko egitea
The evaluation will consist of two parts, a written exam and a set of practical works. The exam (50% of the final mark) will cover the theoretical concepts seen in class, whereas the practical part (remaining 50% of the final mark, divided into multiple works) will consist of implementing the software architectures in virtual environments.Ezohiko deialdia: orientazioak eta uko egitea
Ebaluazioak bi zati izanen ditu, idatzizko azterketa bat eta lan praktiko multzo bat. Azterketak (nota finalaren %50) klasean ikusitako kontzeptu teorikoak ebaluatuko ditu; zati praktikoan (nota finalaren %50, hainbat lanetan banatua), berriz, ingurune birtualetan software-arkitekturak inplementatuko ditugu.Irakasgai-zerrenda
1. Prozesatze-azpiegiturak1. Hodeia
2. Sarea
3. Datacenter-ak
2. Zerbitzu-orkestrazioa
1. Birtualizazioa
3. Prozesatze-arkitekturak
1. Errendimendu handiko informatika
2. Big data
4. Big data prozesatzeko plataformak
1. Batch
2. Streaming eta IoT
Bibliografia
Nahitaez erabili beharreko materiala
Beharrezkoa ez izan arren, gomendagarria da gai honetan proposatzen diren jarduerak garatzeko birtualizazio-lanak egiteko adinako ahalmena duen eramangarri pertsonala izatea.Oinarrizko bibliografia
Tom White. Hadoop: The Definitive Guide: Storage and Analysis at Internet Scale. 2015.Ben Sharma. Architecting Data Lakes, 2nd Edition. 2018.
Neha Narkhede et al. "Kafka" The Definitive Guide: Real-time data and stream processing at scale. 2017.
Jan Kunigk et al. Architecting Modern Data Platforms: A Guide to Enterprise Hadoop at Scale. 2019.
Sam Alapati. Expert Hadoop Administration: Managing, Tuning, and Securing Spark, YARN, and HDFS. 2017.
Aldizkariak
Journal of Big Data (Springer)Big data research (Elsevier)