Kurzus nemzetközi vendég- és részidős hallgatóknak

Kar
Természettudományi Kar
Szervezet
TTK Komplex Rendszerek Fizikája Tanszék
Kód
dsmodelsf20vm
Cím
Adatmodellek és adatbázisok a tudományban
Tervezett félév
Őszi
ECTS
6
Nyelv
en
Oktatás célja
A kurzus célja, hogy a hallgatók megismerkedjenek az adatintenzív tudományos kutatás adatkezelési módszereivel, valamint a számítógépes adatmodellek és indexelési eljárások alapelveivel. Az elméleti tananyaghoz szorosan kapcsolódó számítógépes laboratóriumi gyakorlatok során a hallgatók valódi adatokon, különböző tudományterületről származó problémákat oldanak meg. a) Tudás: Összefüggéseiben átlátja az adatok szerepét a tudományos problémákban és azok adatbázisokba való rendezésének fontosságát. Tisztában van a modern tudományos adatbázisok  lehetőségeivel, fejlődési irányaival és határaival. b) Képességek: Képes a természeti jelenségekben megnyilvánuló fizikai törvényszerűségek felismerésére, a kapcsolódó adatok tudományos igényű elemzésére és az eredmények értelmezésére és az elméleti elvárásokkal való összehasonlításra. c) Attitűd: Folyamatosan törekszik ismeretei bővítésére, új képességek megszerzésére. d) Autonómia és felelősség: Tisztában van a tudományos gondolkodás, a pontos fogalomalkotás fontosságával, véleményét ezek figyelembevételével alakítja ki.
Tantárgy tartalma
1. Tudomány és adatok, exponenciális növekedés, a negyedik paradigma 2. Memória, CPU, I/O, szekvenciális és asszociatív adatelérés, párhuzamosítás, Amdahl-törvény, 3. Adatok elérése, hálózatok és protokollok, adatformátumok, adattárházak 4. Adatfájlok: szöveges és bináris fájlok, hierarchikus adatok és gráfok, képek és tömbök 5. Adattömörítés, dimenzióredukció, zajszűrés 6. Relációs adatbázisok: a relációs adatmodell, az SQL nyelv, imperatív és deklaratív programozás, lekérdezések, indexek és statisztikák 7. A relációs adatmodell megvalósítása: a B-fa, logikai és fizikai operátorok, relációs adatbázis-kezelők, oszlop alapú és memória-adatbázisok, lekérdezés-optimalizáció 8. Az objektumorientált adatmodell, OO—relációs adatillesztés 9. Hierarchikus adatok: JSON és XML adatbázisok, címtárak, XSLT, XPath, XQuery, hierarchikus adatok kezelése relációs adatbázisokban 10. Hálózatok és gráfok, gráfbejárás, gráfstatisztika és gráflekérdezések, triple-store-ok, RDF, gráfok kezelése relációs adatbázisokban 11. Képek és adatkockák, tömbadatbázisok, slicing & dicing, tömbadatbázisok indexelése, tömbadatbázisok lekérdezése 12. Többdimenziós pontfelhők és térbeli adatbázisok, az euklideszi tér és a gömb indexelése, geográfiai és csillagászati adatbázisok 13. Szöveges adatok kezelése, nyelvi elemzés, szótárak és indexek, szabadszöveges keresés. 14. Elosztott adatbázisok, a NoSQL és a Map/Reduce paradigmák, adatfolyamok 15. Metaadatok, adatprovenancia, ontológiák és dinamikus adatmodellek
Számonkérés és értékelés
A félév végi jegy a félév során - a laborgyakorlatokon, valamint házi feladatként elvégzett - feladatok alapján, illetve a félév végi szóbeli vagy írásbeli vizsga eredményei alapján kerül megállapításra.
Irodalomjegyzék
• Hellerstein and Stonebraker (eds.): Readings in Database Systems (MIT Press 2005) • Hanan Samet: Foundations of Multidimensional and Metric Data Structures (Morgan Kaufmann Publishers Inc, 2005) • Joe Celko's SQL Puzzles and Answers • Byron Francis: SQL : The Complete Beginner's Guide - Step By Step Instructions (Byron Francis  2016, ISBN: 1535355697)

Kurzus szakjai

Név (kód) Nyelv Szint Kötelező Tanév ...
Erasmus program keretében (TTK-ERASMUS-NXXX) en Kötelező
kutatófizikus (TTK-FIZIKUS-KUTATÓFIZ-NMEN) en 7 2/2
kutatófizikus (TTK-FIZIKUS-KUTATÓFIZ-NMHU) hu 7 2/2
Tudományos adatanalitika és modellezés specializáció (TTK-FIZIKUS-TUDADATMOD-NMHU) hu 7 Kötelező 2/2
Tudományos adatanalitika és modellezés specializáció (TTK-FIZIKUS-TUDADATMOD-NMEN) en 7 Kötelező 2/2
Vissza