|
Vyučující
|
-
Šanda Martin, Ing. Ph.D.
-
Kašparová Miloslava, Ing. Ph.D.
|
|
Obsah předmětu
|
Úvod do DM (co je data mining (DM), taxonomie DM metod, příklady využití DM, metodiky atd.) Etapy a úkoly metodologie CRISP-DM (porozumění problému, porozumění datům, příprava dat, modelování, vyhodnocení výsledků, využití výsledků v praxi, hierarchický rozklad CRISP-DM). Porozumění datům (základní pojmy: data, datová matice, závislé a nezávislé proměnné, kódování dat, klasifikace dat, formát datového souboru, datový slovník, základní vizualizace dat, zdroje dat atd.) Příprava dat k modelování (datové manipulace se zaměřením na spojování souborů, výběr záznamů, filtrování, generování odvozených proměnných, agregace, náhrada chybějících hodnot proměnné, využití vybraných statistických metod pro přípravu dat atd.) Základy tvorby modelů pomocí vybraných metod (metody shlukové analýzy, vícenásobné lineární regrese, modely na bázi logistická regrese, využití vybraných algoritmů rozhodovacích stromů atd.) a jejich vyhodnocení.
|
|
Studijní aktivity a metody výuky
|
Monologická (výklad, přednáška, instruktáž), Metody samostatných akcí, Pozorování, Demonstrace
- Semestrální práce
- 100 hodin za semestr
- Samostatná kritická četba
- 15 hodin za semestr
- Sběr materiálu
- 20 hodin za semestr
- Domácí příprava na výuku
- 25 hodin za semestr
- Příprava na zkoušku
- 88 hodin za semestr
- Kontaktní výuka
- 52 hodin za semestr
|
|
Výstupy z učení
|
Cílem předmětu je seznámit studenty s možnostmi data miningu (DM). Na úvodní část navazuje problematika definování cílů a technik pro DM, výběr zdrojů dat a jejich příprava pro modelování, tvorba modelů a jejich vyhodnocení.
Student bude schopen definovat jednotlivé fáze DM projektu a jejich obsah. S využitím sw nástrojů bude umět řešit jednoduché úlohy v oblasti přípravy a dat a vybrat odpovídající metodu pro tvorbu modelu.
|
|
Předpoklady
|
U studenta se předpokládá znalost základů práce s databází v rozsahu předmětu Databázové systémy I (FDS1), základní znalost matematiky, základní zpracování datového souboru v rozsahu předmětu Manažerská informatika I (MFI1) včetně základní úpravy textového souboru v textovém editoru, základní znalost vybraných statistických metod v rozsahu předmětu Počítačové zpracování podnikových dat (FPZD) nebo Pravděpodobnost a statistika (FPAS).
|
|
Hodnoticí metody a kritéria
|
Písemná zkouška, Posouzení zadané práce, Rozbor produktů pracovní činnosti studenta
Požadavky k zápočtu: účast na cvičení (75%), zpracování zadaných úloh na cvičení, odevzdání semestrální práce podle zadání. Požadavky ke zkoušce (včetně formy zkoušky): písemná
|
|
Doporučená literatura
|
-
Berka, Petr. Dobývání znalostí z databází. Praha: Academia, 2003. ISBN 80-200-1062-9.
-
Berry, Michael J. A. Data mining techniques : for marketing, sales, and customer relationship management. Indianapolis: Wiley, 2004. ISBN 0-471-47064-3.
-
Berry, Michael J. A. Mastering data mining. New York: John Wiley & Sons, 2000. ISBN 0-471-33123-6.
-
Petr, Pavel. Data Mining.. Pardubice: Univerzita Pardubice, 2006. ISBN 80-7194-886-1.
-
Petr, Pavel. Metody Data Miningu.. Pardubice: Univerzita Pardubice, 2014. ISBN 978-80-7395-872-5.
-
Petr, Pavel. Metody Data Miningu.. Pardubice: Univerzita Pardubice, 2015. ISBN 978-80-7395-873-2.
-
PYLE, D. Data Preparation for Data Mining. San Diego, Academic Press, 1999, 540 s.. San Diego, 1999.
-
RUD, O. L. Data Mining - Praktický průvodce dolováním dat pro efektivní prodej, cílený marketing a podporu zákazníků (CRM). Praha, Computer Press, 2001, 330 s.. 2001.
-
Wendler, T., Gröttrup, S. Data Mining with SPSS Modeler. 2016.
|