Kurzus nemzetközi vendég- és részidős hallgatóknak
- Kar
- Informatikai Kar
- Szervezet
- IK Adattudományi és Adattechnológiai Tanszék
- Kód
- IPM-24ATIDSEG
- Cím
- Bevezetés az adattudományba Ea+Gy.
- Tervezett félév
- Őszi
- Meghirdetve
- 2024/25/1, 2024/25/2
- ECTS
- 6
- Nyelv
- en
- Oktatás célja
- tudása Ismeri az adattudomány főbb alkalmazási területeit, az ezekhez kötődő problémákat és a megoldási lehetőségek főbb irányait, a kapcsolódó technikák alkalmazási korlátait. összefüggéseket tud teremteni az egyes adattípusok között, képes az adatok transzformációján alapuló információ-kinyerésre és feladatmegoldásra multidiszciplináris környezetben is. képességei Képes az előírt feladathoz tartozó nyers adat transzformációs lépéseinek megalkotására. Ismeri az adatelemek közötti függőségi viszonyokat és az adatok strukturálhatóságát, típusait. A technológia változása esetén képes az adatelemzési stratégiát a technológiától függetleníteni. attitűd Figyelemmel kíséri az adattudomány és a kapcsolódó szakterületek elsősorban matematikai, statisztikai, informatikai vonatkozású, valamint mesterséges intelligenciával kapcsolatos legújabb eredményeit és törekszik arra, hogy ezeket saját fejlődésének szolgálatába állítsa. Hitelesen képviseli szakmáját és mutatja be munkájának eredményeit. autonómiája és felelőssége Nagy figyelmet fordít feladatainak precíz elvégzésre és a határidők pontos betartására, illetve betartatására.
- Tantárgy tartalma
- A kurzus a főbb adattudományi modellek és technikák alapját képező alapfogalmak és alapvető elméletek bemutatásával foglalkozik. Az olyan eljárások, mint a klaszterezés és a gyakori minták bányászata részletesebben kerülnek ismertetésre, míg a prediktív technikák esetében a hangsúly főként a modell fogalmára, paramétereire és hiperparamétereire, valamint a modellek minőségére és validálására helyeződik, beleértve a túlillesztés- alulillesztés jelenségét és a torzítás-eltérés közötti trade-off kapcsolatot is. A félév során a hallgatók különböző adattípusokhoz és modellezési problémákhoz kapcsolódó adatminőségi és előfeldolgozási kérdésekkel is foglalkoznak. Mindezeken túl az alapvető ajánlórendszeri technikák és a CRISP-DM módszertan is ismertetésre kerül a kurzusban. Klaszterezés: k-means, agglomeratív, DBSCAN, klaszterek validálása; Gyakori mintázatok bányászata: elemhalmazok, asszociációs szabályok, minőségi mérőszámok; Lineáris osztályozás és regresszió: modell, paraméterek és hiperparaméterek, validálás, túlillesztés- alulillesztés és a torzítás-variáció kapcsolat; Bevezetés a hagyományos előrejelzési technikákba (mint black-box függvények); adatminőség és előfeldolgozás: zaj, hiányzó értékek, adattranszformáció, normalizálás; a CRISP-DM módszertan
- Számonkérés és értékelés
- összevont számonkérés
- Irodalomjegyzék
- Peter Flach (2012). Machine Learning: The Art and Science of Algorithms that Make Sense of Data. Cambridge University Press. Jiawei Han, Micheline Kamber, Jian Pei (2011). Data Mining: Concepts and Techniques. Morgan Kaufmann. Pang-Ning Tan, Michael Steinbach, Vipin Kumar (2005). Introduction to Data Mining. Addison Wesley.
Kurzus szakjai
Név (kód) | Nyelv | Szint | Kötelező | Tanév | ... |
---|---|---|---|---|---|
adattudomány (IK-ADATTUD-NMEN) | en | 7 | Kötelező | 1/2 |