Kurzus nemzetközi vendég- és részidős hallgatóknak
- Kar
- Természettudományi Kar
- Szervezet
- TTK Komplex Rendszerek Fizikája Tanszék
- Kód
- dsexplorf20vm
- Cím
- Adatexploráció és vizualizáció
- Tervezett félév
- Tavaszi
- Meghirdetve
- 2025/26/2
- ECTS
- 6
- Nyelv
- en
- Oktatás célja
- A kurzus célja az adatok felkutatásához, feldolgozásához és megjelenítéséhez szükséges fogalmak és módszerek elsajátítása és ezen a területen való tapasztalat szerzése. A megszerzett képességek, nem csak a fizika nagy mennyiségű adatot előállító területein alkalmazható, hanem bármely területen, ahol adatok keletkeznek. a) Tudás: Ismeri a fizika számítógépes módszereit, valamint a matematika és az informatika fizikát érintő területeit. Ismeri a tudományos kutatás, az önképzés és a kommunikáció magas szintű módszereit. Magas szinten rendelkezik adattudományos ismeretekkel és az erre épülő gyakorlat elemeinek ismeretével, és rendszerezni tudja azokat. Elmélyült és alapos szakmai tudással rendelkezik, amelynek alkalmazása szükséges természeti folyamatok, természeti erőforrások, élő és élettelen rendszerek szakterületéhez tartozó gyakorlati problémáinak megoldásához. b) Képességek: Képes az informatika fizikát érintő szakterületeinek művelésére. Az adattudományban szerzett elmélyült ismeretei alapján képes adatgyűjtési, feldolgozási folyamatok megtervezésére, és az eredmények megjelenítésére. Képes tudásának folyamatos gyarapítására és tanulmányainak doktori képzés keretében történő folytatására. Tanulmányai során szerzett ismeretei és problémamegoldó készsége segítségével képes önálló és kiegészítő munkakörök betöltésére az adattudomány eszközeit és módszereit felhasználó bármely területen c) Attitűd: Jellemző tulajdonságai a kreativitás, rugalmasság, a probléma felismerő és megoldó készség, az intuíció, a módszeresség és adatfeldolgozási képesség. Munkatársaival aktívan együttműködik, konstruktív módon vesz részt csoportmunkában. Szakterülete problémáit szakemberek és laikusok számára egyaránt szakszerűen megfogalmazza. Folyamatosan törekszik ismeretei bővítésére, új képességek megszerzésére. d) Autonómia és felelősség: Önállóan képes a rendelkezére álló adatok kezelésére, feldolgozására és azok hitelességének és lekövethetőségének biztosítására.
- Tantárgy tartalma
- A tantárgy célja, hogy a hallgatók egy intenzív, feladatorientált kurzus keretében gyakorlatban hasznosítható tudást szerezzenek egy vagy több választott tudományterület fontosabb publikus adattárházairól, a különböző adatmodellek és adatformátumok használatáról, valamint az adatok elérésének, feldolgozásának és vizualizációjának mikéntjéről. A kiadott projektek elvégzése során megszerzendő ismeretek tapasztalati alapot szolgáltatnak a későbbi, elméleti megközelítésű adatbányászati kurzusokhoz, valamint a haladó szintű számítógépes laboratóriumokhoz. 1. Adattípusok, képek, idősorok, táblázatok, gráfok, szöveges adatok 2. Szabványos fájlformátumok és adatformátumok 3. Nyers és feldolgozott adatok, metaadatok, adattisztítás 4. Nyílt forráskódú szoftverfejlesztés 5. Lokális és webes adatok elérése, web API-k használata 6. Tudományos adattárházak, adatbázisok elérése 7. Relációs adatbázisok használata 8. Adatok transzformációi, rendezés, adatok kombinációja 9. Az idősor-elemzés alapjai 10. A képfeldolgozás alapjai 11. Dimenzióredukció, klaszterezés 12. Grafikontípusok, vizualizáció 13. Interaktív adatfelfedező eszközök 14. Reprodukálható kutatás
- Számonkérés és értékelés
- A hallgatóknak 8-10 témából kell egy beszámolót vagy infografikát elkészíteni . A beküldött munkák két szempont alapján kerül pontozásra: 1, az alfeladatokra adott végeredmény és ayokból levont következtetés és 2, a beszámolók minősége, kinézete és érthetősége alapján
- Irodalomjegyzék
- * Wes McKinney: Python for Data Analysis, (O’Reilly 2013) * Joel Grus: Data Science from Scratch (O’Reilly 2015) * Reprodukálható munkafolyamat, https://buildmedia.readthedocs.org/media/pdf/reproducible-analysis-workshop/latest/reproducible-analysis-workshop.pdf * Miért készítsünk dahsboardokat? https://towardsdatascience.com/dashboards-are-dead-b9f12eeb2ad2 * Tudományos kódfejlesztés és munkafolyamat, https://towardsdatascience.com/workflow-for-reportable-reusable-and-reproducible-computational-research-45d036c8a908