Kurzus nemzetközi vendég- és részidős hallgatóknak
- Kar
- Természettudományi Kar
- Szervezet
- TTK Komplex Rendszerek Fizikája Tanszék
- Kód
- dsmodelsf20vm
- Cím
- Adatmodellek és adatbázisok a tudományban
- Tervezett félév
- Őszi
- ECTS
- 6
- Nyelv
- en
- Oktatás célja
- A kurzus célja, hogy a hallgatók megismerkedjenek az adatintenzív tudományos kutatás adatkezelési módszereivel, valamint a számítógépes adatmodellek és indexelési eljárások alapelveivel. Az elméleti tananyaghoz szorosan kapcsolódó számítógépes laboratóriumi gyakorlatok során a hallgatók valódi adatokon, különböző tudományterületről származó problémákat oldanak meg. a) Tudás: Összefüggéseiben átlátja az adatok szerepét a tudományos problémákban és azok adatbázisokba való rendezésének fontosságát. Tisztában van a modern tudományos adatbázisok lehetőségeivel, fejlődési irányaival és határaival. b) Képességek: Képes a természeti jelenségekben megnyilvánuló fizikai törvényszerűségek felismerésére, a kapcsolódó adatok tudományos igényű elemzésére és az eredmények értelmezésére és az elméleti elvárásokkal való összehasonlításra. c) Attitűd: Folyamatosan törekszik ismeretei bővítésére, új képességek megszerzésére. d) Autonómia és felelősség: Tisztában van a tudományos gondolkodás, a pontos fogalomalkotás fontosságával, véleményét ezek figyelembevételével alakítja ki.
- Tantárgy tartalma
- 1. Tudomány és adatok, exponenciális növekedés, a negyedik paradigma 2. Memória, CPU, I/O, szekvenciális és asszociatív adatelérés, párhuzamosítás, Amdahl-törvény, 3. Adatok elérése, hálózatok és protokollok, adatformátumok, adattárházak 4. Adatfájlok: szöveges és bináris fájlok, hierarchikus adatok és gráfok, képek és tömbök 5. Adattömörítés, dimenzióredukció, zajszűrés 6. Relációs adatbázisok: a relációs adatmodell, az SQL nyelv, imperatív és deklaratív programozás, lekérdezések, indexek és statisztikák 7. A relációs adatmodell megvalósítása: a B-fa, logikai és fizikai operátorok, relációs adatbázis-kezelők, oszlop alapú és memória-adatbázisok, lekérdezés-optimalizáció 8. Az objektumorientált adatmodell, OO—relációs adatillesztés 9. Hierarchikus adatok: JSON és XML adatbázisok, címtárak, XSLT, XPath, XQuery, hierarchikus adatok kezelése relációs adatbázisokban 10. Hálózatok és gráfok, gráfbejárás, gráfstatisztika és gráflekérdezések, triple-store-ok, RDF, gráfok kezelése relációs adatbázisokban 11. Képek és adatkockák, tömbadatbázisok, slicing & dicing, tömbadatbázisok indexelése, tömbadatbázisok lekérdezése 12. Többdimenziós pontfelhők és térbeli adatbázisok, az euklideszi tér és a gömb indexelése, geográfiai és csillagászati adatbázisok 13. Szöveges adatok kezelése, nyelvi elemzés, szótárak és indexek, szabadszöveges keresés. 14. Elosztott adatbázisok, a NoSQL és a Map/Reduce paradigmák, adatfolyamok 15. Metaadatok, adatprovenancia, ontológiák és dinamikus adatmodellek
- Számonkérés és értékelés
- A félév végi jegy a félév során - a laborgyakorlatokon, valamint házi feladatként elvégzett - feladatok alapján, illetve a félév végi szóbeli vagy írásbeli vizsga eredményei alapján kerül megállapításra.
- Irodalomjegyzék
- • Hellerstein and Stonebraker (eds.): Readings in Database Systems (MIT Press 2005) • Hanan Samet: Foundations of Multidimensional and Metric Data Structures (Morgan Kaufmann Publishers Inc, 2005) • Joe Celko's SQL Puzzles and Answers • Byron Francis: SQL : The Complete Beginner's Guide - Step By Step Instructions (Byron Francis 2016, ISBN: 1535355697)