Kurzus nemzetközi vendég- és részidős hallgatóknak

Kar
Informatikai Kar
Szervezet
IK Adattudományi és Adattechnológiai Tanszék
Kód
IPM-24ATOSTEG
Cím
Nyílt forráskódú technológiák valós idejű adatelemzéshez Ea+Gy.
Tervezett félév
Őszi
ECTS
6
Nyelv
Oktatás célja
tudása Tisztában van az elemzéshez, modellezéshez használt aktuális technológiák működésével és képes azok valós körülmények között történő alkalmazására nagy mennyiségű adat esetében is. Ismeri a nagymennyiségű adatok tárolására, feldolgozására és vizualizációjára szolgáló technikákat, tisztában van az egyes eszközrendszerek tulajdonságaival. Ismeri az adattudomány főbb alkalmazási területeit, az ezekhez kötődő problémákat és a megoldási lehetőségek főbb irányait, a kapcsolódó technikák alkalmazási korlátait. Összefüggéseket tud teremteni az egyes adattípusok között, képes az adatok transzformációján alapuló információ-kinyerésre és feladatmegoldásra multidiszciplináris környezetben is. Az angol nyelvtudása eléri a képzéshez, az angol nyelvű szakirodalom megismeréséhez, a szakszöveg megértéséhez, feldolgozásához és a szakképzettséggel ellátható szakmai feladatok elvégzéséhez, valamint a folyamatos szakmai önképzéshez szükséges szintet. képességei Képes az előírt feladathoz tartozó nyers adat transzformációs lépéseinek megalkotására. Képes az adatokat kontextusba helyezve más információkkal összekapcsolni, egyesítve különböző modalitásokat. Ismeri az adatelemek közötti függőségi viszonyokat és az adatok strukturálhatóságát, típusait. A technológia változása esetén képes az adatelemzési stratégiát a technológiától függetleníteni. Képes nagy mennyiségű adat hatékony vizualizációjára, az eredmények interpretálására. Képes a rutinproblémák felismerésén és megoldásán túl eredeti ötleteket felvetni. Szakmai irányítás mellett képes önálló tudományos kutatómunkát végezni. attitűd Figyelemmel kíséri az adattudomány és a kapcsolódó szakterületek elsősorban matematikai, statisztikai, informatikai vonatkozású, valamint mesterséges intelligenciával kapcsolatos legújabb eredményeit és törekszik arra, hogy ezeket saját fejlődésének szolgálatába állítsa. Tiszteletben tartja és munkája során figyelembe veszi az övétől eltérő véleményeket, kizárólag a szakmai érvekkel történő meggyőzést tartja elfogadhatónak. autonómiája és felelőssége Alkalmas mind egyénileg, mind pedig egy csoport tagjaként vagy vezetőjeként elemzői, modellezői és egyéb, az adattudománnyal kapcsolatos feladatok elvégzésére. Felelősséget vállal a vele együtt dolgozó vagy irányítása alatt állók munkájáért. Felelősen, az aktuális szabályozásnak megfelelően kezeli a rábízott érzékeny, esetlegesen bizalmas adatokat.
Tantárgy tartalma
A tanfolyam során a hallgatók megismerik a legismertebb nyílt forráskódú és ingyenesen (is) elérhető eszközöket és technológiákat amelyek lehetővé teszik a nagy adatok illetve adatfolyamok fogadását, tárolását, elemzését és megjelenítését. A rendelkezésre álló véges időkeretre való tekintettel a következő eszközök, platformok és technológiák elemzése várható: Adatok fogadás és tárolása: Cassandra, InfluxDB és HBase; Nagy adatok elemzése: Spark és ElasticSearch; Adatfolyamok elemzése: Kafka és Flink; Gráfok elemzés: GraphX; Adatok és elemzések eredményeinek megjelenítése: Tableau, Kibana, seaborn;
Számonkérés és értékelés
összevont számonkérés, gyakorlati projektmunka
Irodalomjegyzék
Neha Narkhede, Gwen Shapira, Todd Palino (2017). Kafka: The Definitive Guide: Real-Time Data and Stream Processing at Scale. O'Reilly Media, 1st Edition. Tom White (2015). Hadoop: The Definitive Guide: Storage and Analysis at Internet Scale. O'Reilly Media, 4th Edition. Jeff Carpenter, Eben Hewitt (2020). Cassandra: The Definitive Guide: Distributed Data at Web Scale. O'Reilly Media, 3rd Edition. Bill Chambers, Matei Zaharia (2018). Spark: The Definitive Guide: Big Data Processing Made Simple. O'Reilly Media, 1st Edition. Tyler Akidau, Slava Chernyak, Reuven Lax (2018). Streaming Systems: The What, Where, When, and How of Large-Scale Data Processing. O'Reilly Media, 1st Edition.

Kurzus szakjai

Név (kód) Nyelv Szint Kötelező Tanév ...
adattudomány (IK-ADATTUD-NMEN) en 7 Kötelező 2/2
Vissza