Kurzus nemzetközi vendég- és részidős hallgatóknak

Kar
Természettudományi Kar
Szervezet
TTK Komplex Rendszerek Fizikája Tanszék
Kód
dsexplorf20vm
Cím
Adatexploráció és vizualizáció
Tervezett félév
Tavaszi
Meghirdetve
2025/26/2
ECTS
6
Nyelv
en
Oktatás célja
A kurzus célja az adatok felkutatásához, feldolgozásához és megjelenítéséhez szükséges fogalmak és módszerek elsajátítása és ezen a területen való tapasztalat szerzése. A megszerzett képességek, nem csak a fizika nagy mennyiségű adatot előállító területein alkalmazható, hanem bármely területen, ahol adatok keletkeznek. a) Tudás: Ismeri a fizika számítógépes módszereit, valamint a matematika és az informatika fizikát érintő területeit. Ismeri a tudományos kutatás, az önképzés és a kommunikáció magas szintű módszereit. Magas szinten rendelkezik adattudományos ismeretekkel és az erre épülő gyakorlat elemeinek ismeretével, és rendszerezni tudja azokat. Elmélyült és alapos szakmai tudással rendelkezik, amelynek alkalmazása szükséges természeti folyamatok, természeti erőforrások, élő és élettelen rendszerek szakterületéhez tartozó gyakorlati problémáinak megoldásához. b) Képességek: Képes az informatika fizikát érintő szakterületeinek művelésére. Az adattudományban szerzett elmélyült ismeretei alapján képes adatgyűjtési, feldolgozási folyamatok megtervezésére, és az eredmények megjelenítésére. Képes tudásának folyamatos gyarapítására és tanulmányainak doktori képzés keretében történő folytatására. Tanulmányai során szerzett ismeretei és problémamegoldó készsége segítségével képes önálló és kiegészítő munkakörök betöltésére az adattudomány eszközeit és módszereit felhasználó bármely területen c) Attitűd: Jellemző tulajdonságai a kreativitás, rugalmasság, a probléma felismerő és megoldó készség, az intuíció, a módszeresség és adatfeldolgozási képesség. Munkatársaival aktívan együttműködik, konstruktív módon vesz részt csoportmunkában. Szakterülete problémáit szakemberek és laikusok számára egyaránt szakszerűen megfogalmazza. Folyamatosan törekszik ismeretei bővítésére, új képességek megszerzésére. d) Autonómia és felelősség: Önállóan képes a rendelkezére álló adatok kezelésére, feldolgozására és azok hitelességének és lekövethetőségének biztosítására.
Tantárgy tartalma
A tantárgy célja, hogy a hallgatók egy intenzív, feladatorientált kurzus keretében gyakorlatban hasznosítható tudást szerezzenek egy vagy több választott tudományterület fontosabb publikus adattárházairól, a különböző adatmodellek és adatformátumok használatáról, valamint az adatok elérésének, feldolgozásának és vizualizációjának mikéntjéről. A kiadott projektek elvégzése során megszerzendő ismeretek tapasztalati alapot szolgáltatnak a későbbi, elméleti megközelítésű adatbányászati kurzusokhoz, valamint a haladó szintű számítógépes laboratóriumokhoz. 1. Adattípusok, képek, idősorok, táblázatok, gráfok, szöveges adatok 2. Szabványos fájlformátumok és adatformátumok 3. Nyers és feldolgozott adatok, metaadatok, adattisztítás 4. Nyílt forráskódú szoftverfejlesztés 5. Lokális és webes adatok elérése, web API-k használata 6. Tudományos adattárházak, adatbázisok elérése 7. Relációs adatbázisok használata 8. Adatok transzformációi, rendezés, adatok kombinációja 9. Az idősor-elemzés alapjai 10. A képfeldolgozás alapjai 11. Dimenzióredukció, klaszterezés 12. Grafikontípusok, vizualizáció 13. Interaktív adatfelfedező eszközök 14. Reprodukálható kutatás
Számonkérés és értékelés
A hallgatóknak 8-10 témából kell egy beszámolót vagy infografikát elkészíteni . A beküldött munkák két szempont alapján kerül pontozásra: 1, az alfeladatokra adott végeredmény és ayokból levont következtetés és 2, a beszámolók minősége, kinézete és érthetősége alapján
Irodalomjegyzék
* Wes McKinney: Python for Data Analysis, (O’Reilly 2013) * Joel Grus: Data Science from Scratch (O’Reilly 2015) * Reprodukálható munkafolyamat, https://buildmedia.readthedocs.org/media/pdf/reproducible-analysis-workshop/latest/reproducible-analysis-workshop.pdf * Miért készítsünk dahsboardokat? https://towardsdatascience.com/dashboards-are-dead-b9f12eeb2ad2 * Tudományos kódfejlesztés és munkafolyamat, https://towardsdatascience.com/workflow-for-reportable-reusable-and-reproducible-computational-research-45d036c8a908

Kurzus szakjai

Név (kód) Nyelv Szint Kötelező Tanév ...
bioinformatikus (TTK-BIOLÓGUS-BIOINFORMAT-NMEN) en 7 2/2
Erasmus program keretében (TTK-ERASMUS-NXXX) en Kötelező
idegtudomány és humánbiológia (TTK-BIOLÓGUS-IDEGTUDHUMB-NMEN) en 7 2/2
kutatófizikus (TTK-FIZIKUS-KUTATÓFIZ-NMEN) en 7 1/2
kutatófizikus (TTK-FIZIKUS-KUTATÓFIZ-NMHU) hu 7 1/2
molekuláris genetika, sejt- és fejlődésbiológia (TTK-BIOLÓGUS-MOLGSEJTFEJ-NMEN) en 7 2/2
molekuláris, immun- és mikrobiológia (TTK-BIOLÓGUS-MOLIMMMIKRO-NMEN) en 7 2/2
növénybiológia és mikológia (TTK-BIOLÓGUS-NÖVBIOLMIKOL-NMEN) en 7 2/2
ökológia, evolúció- és konzervációbiológia (TTK-BIOLÓGUS-ÖKOEVOKONZ-NMEN) en 7 2/2
Tudományos adatanalitika és modellezés specializáció (TTK-FIZIKUS-TUDADATMOD-NMEN) en 7 Kötelező 1/2
Tudományos adatanalitika és modellezés specializáció (TTK-FIZIKUS-TUDADATMOD-NMHU) hu 7 Kötelező 1/2
Vissza