Předmět: Advanced Statistical and Mathematical Methods in Data Science

« Zpět
Název předmětu Advanced Statistical and Mathematical Methods in Data Science
Kód předmětu FES/EPMMS
Organizační forma výuky Přednáška + Seminář
Úroveň předmětu Doktorský
Rok studia nespecifikován
Semestr Zimní a letní
Počet ECTS kreditů 20
Vyučovací jazyk Angličtina
Statut předmětu Povinný
Způsob výuky Kontaktní
Studijní praxe Nejedná se o pracovní stáž
Doporučené volitelné součásti programu Není
Vyučující
  • Munk Michal, prof. RNDr. Ph.D.
Obsah předmětu
Měřící postupy a kvalita měření (odhad objektivity, reliability a validity). Výzkumné plány a metodika výzkumu (cenzus, výběrové získávání dat, experiment). Zdroje dat (kombinace a rozšíření zdrojů dat, metodiky obhajování znalostí, objevování znalostí vs. výzkumné plány). Explorační analýza (sumarizace, deskripce a vizualizace dat, analýza reziduálních hodnot, transformace dat). Pravděpodobnost jako teoretický základ inferenční analázy (normální rozdělení náhodné proměnné, přehled rozdělení odvozených od normálního rozdělení). Inferenční analýza (odhady parametrů a testování hypotéz, parametrické/neparametrické testy, závislé/nezávislé vzorky, jednorozměrné/vícerozměrné analýzy). Základní statistické metody (popisná statistika, testy rozdělení, testy o rozptylu a jejich neparametrické alternativy, testy o střední hodnotě a jejejich neparametrické alternativy, vztahy mezi proměnnými). Vícerozměrné metody (míry vztahů, segmentace, klasifikace, snižování počtu dimenzí, analýza spolehlivosti). Lineární modely (regresní analýza, analýza rozptylu), všeobecné lineární modely GLM, zobecněné lineární modely GLZM.

Studijní aktivity a metody výuky
Dialogická (diskuze, rozhovor, brainstorming)
Výstupy z učení
Cílem předmětu je osvojení faktických, konceptuálních a procedurálních vědomostí ze statistických a matematických metod, které umí student tvořivě aplikovat ve vědecké práci v oboru aplikovaná informatika. Student dovede uplatnit postupy statistické analýzy za účelem ověření výzkumných hypotéz a předpokladů. Za tímto účelem dokáže získat potřebná data prostřednictvím měřících procedur, resp. zhodnotit zdroje dat, kombinovat zdroje dat a rozšířit zdroje dat o data získaná vlastním výzkumem. Umí kriticky analyzovat a syntetizovat výzkumné koncepty, referovat o výsledcích analýzy, vykonávat statistické predikce a poskytnout vizuální prezentaci dat.

Předpoklady
nespecifikováno

Hodnoticí metody a kritéria
Obhajoba vlastního projektu

Úspešné absolvování předmětu je podmíněné prokázáním schopnosti aplikovat získané znalosti do vědecké práce. Podmínky absolvování: Úspěšné absolvovaní předmětu je podmíněné zkouškou a samostatným řešením projektu. Ústní zkouška se skládá z teoretických otázek (40%) a z obhajoby projektu (60%). Hodnocení předmětu je dané výsledkem zkoušky. Kredity nebudou udělené studentovi, který získá v celkovém bodovém hodnocení méně jak 70 procent.
Doporučená literatura
  • Agbinya, J. I. Applied Data Analytics - Principles and Applications. Publishers, 2020. ISBN 978-87-7022-095-8.
  • Munk, M., Pilkova, A., Benko, L., Blazekova, P., Svec, P. Methodology of stakeholders' behaviour modelling based on time. Elsevier, 2021.
  • Munk, M., Pilkova, A., Benko, L., Blazekova, P., Svec, P. Pillar 3 - Pre-processed web server log file dataset of the banking institution. Elsevier, 2021.
  • Santos, M. Y., Costa, C. Big Data : Concepts, Warehousing, and Analytics. River Publishers, 2020. ISBN 978-1-119-52841-8.
  • Stuard, D. Practical Data Science for Information Professionals. Facet Publishing, 2020. ISBN 978-1-78330-346-5.
  • Verma, J. P., Abdel-Salam, G. Testing Statistical Assumptions in Research. John Wiley & Sons: Incorporated, 2019. ISBN 978-1-119-52841-8.


Studijní plány, ve kterých se předmět nachází
Fakulta Studijní plán (Verze) Kategorie studijního oboru/specializace Doporučený ročník Doporučený semestr