Kurzus nemzetközi vendég- és részidős hallgatóknak
- Kar
- Természettudományi Kar
- Szervezet
- TTK Komplex Rendszerek Fizikája Tanszék
- Kód
- dsminingf20vm
- Cím
- Adatbányászat és gépi tanulás
- Tervezett félév
- Őszi
- ECTS
- 6
- Nyelv
- en
- Oktatás célja
- Az tantárgy célja, hogy tetszőleges kvantitatív tudományterületen alkalmazható elméleti és gyakorlati tudást adjon a modern adatbányászati és gépi tanulási technikák témaköréből. A tantárgy első sorban az adatvezérelt kutatás empirikus módszereire fókuszál, így jól kiegészíti a modell alapú elméleti fizikai ismereteket. a) Tudás: Összefüggéseiben átlátja a fizikának az adatok elemzésével vizsgálható folyamatait, rendszereit, és tudományos problémáit. Tisztában van a modern fizikai mérések és szimulációk adatainak aktuális vizsgálati lehetőségeivel, fejlődési irányaival és határaival. b) Képességek: Képes a természeti jelenségekben megnyilvánuló fizikai törvényszerűségek felismerésére, a kapcsolódó adatok tudományos igényű elemzésére és az eredmények értelmezésére és az elméleti elvárásokkal való összehasonlításra. c) Attitűd: Folyamatosan törekszik ismeretei bővítésére, új képességek megszerzésére. d) Autonómia és felelősség: Tisztában van a tudományos gondolkodás, a pontos fogalomalkotás fontosságával, véleményét ezek figyelembevételével alakítja ki.
- Tantárgy tartalma
- 1. Bevezetés, predikció, tanító halmaz 2. Adatbányászati és gépi tanulási eszköztárak 3. Adatfeltárás (data exploration) 4. Felügyelt tanulás, célfüggvények, klasszifikáció, regresszió, validáció 5. Regularizáció, modell optimalizáció 6. Döntési fák, random forest 7. Support vector machine 8. Neuronhálózatok 9. Deep Learning 10. Kép- és hangfeldolgozás 11. Nem felügyelt tanítás, dimenzióredukciós módszerek, klaszterezés 12. Gépi tanulás nagy adatokon és elosztott rendszereken
- Számonkérés és értékelés
- Rendszeresen beküldendő házi feladatok és egy féléves projekt írásban beadott összefoglalója.
- Irodalomjegyzék
- • Gareth James, Daniela Witten, Trevor Hastie, Robert Tibshirani: An Introduction to Statistical Learning: with Applications in R (Springer Texts in Statistics) , Springer 2016 • Trevor Hastie, Robert Tibshirani, Jerome Friedman: The Elements of Statistical Learning: Data Mining, Inference, and Prediction, Springer, 2009 • Ian Goodfellow, Yoshua Bengio, Aaron Courville: Deep Learning (Adaptive Computation and Machine Learning series), MIT Press, 2016