Předmět: Data Mining I

« Zpět
Název předmětu Data Mining I
Kód předmětu USII/CDM1
Organizační forma výuky Konzultace
Úroveň předmětu Bakalářský
Rok studia 3
Semestr Zimní
Počet ECTS kreditů 10
Vyučovací jazyk Čeština
Statut předmětu Povinný
Způsob výuky Kontaktní
Studijní praxe Nejedná se o pracovní stáž
Doporučené volitelné součásti programu Není
Vyučující
  • Kašparová Miloslava, Ing. Ph.D.
Obsah předmětu
Úvod do DM (co je data mining (DM), taxonomie DM metod, příklady využití DM, metodiky atd.) Etapy a úkoly metodologie CRISP-DM (porozumění problému, porozumění datům, příprava dat, modelování, vyhodnocení výsledků, využití výsledků v praxi, hierarchický rozklad CRISP-DM). Porozumění datům (základní pojmy: data, datová matice, závislé a nezávislé proměnné, kódování dat, klasifikace dat, formát datového souboru, datový slovník, základní vizualizace dat, zdroje dat atd.) Příprava dat k modelování (datové manipulace se zaměřením na spojování souborů, výběr záznamů, filtrování, generování odvozených proměnných, agregace, náhrada chybějících hodnot proměnné, využití vybraných statistických metod pro přípravu dat atd.) Základy tvorby modelů pomocí vybraných metod (metody shlukové analýzy, vícenásobné lineární regrese, modely na bázi logistická regrese, využití vybraných algoritmů rozhodovacích stromů atd.) a jejich vyhodnocení.

Studijní aktivity a metody výuky
Monologická (výklad, přednáška, instruktáž), Metody samostatných akcí, Pozorování, Demonstrace
Výstupy z učení
Cílem předmětu je seznámit studenty s možnostmi data miningu (DM). Na úvodní část navazuje problematika definování cílů a technik pro DM, výběr zdrojů dat a jejich příprava pro modelování, tvorba modelů a jejich vyhodnocení.
Student bude schopen definovat jednotlivé fáze DM projektu a jejich obsah. S využitím sw nástrojů bude umět řešit jednoduché úlohy v oblasti přípravy a dat a vybrat odpovídající metodu pro tvorbu modelu.
Předpoklady
U studenta se předpokládá znalost základů práce s databází v rozsahu předmětu Databázové systémy I (CDS1), základní znalost matematiky, základní zpracování datového souboru v rozsahu předmětu Manažerská informatika I (CMI1) včetně základní úpravy textového souboru v textovém editoru, základní znalost vybraných statistických metod v rozsahu předmětu Pravděpodobnost a statistika (CPAS).

Hodnoticí metody a kritéria
Ústní zkouška, Písemná zkouška, Posouzení zadané práce, Rozbor produktů pracovní činnosti studenta

Požadavky k zápočtu: zpracovat zadané úlohy s úspěšností min. 60%, odevzdání semestrální práce podle zadání. Požadavky ke zkoušce (včetně formy zkoušky): ústní, písemná Obhájit případné otázky k semestrální práci a úspěšné absolvování písemné části zkoušky (min. 60%). Výsledné hodnocení je dané poměrem 40% cvičení a semináře, 60% obhajoba závěrečná práce a hodnocení z písemné a ústní části zkoušky.
Doporučená literatura
  • Berka, Petr. Dobývání znalostí z databází. Praha: Academia, 2003. ISBN 80-200-1062-9.
  • Berry, Michael J. A. Data mining techniques : for marketing, sales, and customer relationship management. Indianapolis: Wiley, 2004. ISBN 0-471-47064-3.
  • Berry, Michael J. A. Mastering data mining. New York: John Wiley & Sons, 2000. ISBN 0-471-33123-6.
  • Petr, Pavel. Data Mining.. Pardubice: Univerzita Pardubice, 2006. ISBN 80-7194-886-1.
  • Petr, Pavel. Metody Data Miningu.. Pardubice: Univerzita Pardubice, 2014. ISBN 978-80-7395-872-5.
  • Petr, Pavel. Metody Data Miningu.. Pardubice: Univerzita Pardubice, 2015. ISBN 978-80-7395-873-2.
  • PYLE, D. Data Preparation for Data Mining. San Diego, Academic Press, 1999, 540 s.. San Diego, 1999.
  • RUD, O. L. Data Mining - Praktický průvodce dolováním dat pro efektivní prodej, cílený marketing a podporu zákazníků (CRM). Praha, Computer Press, 2001, 330 s.. 2001.
  • Wendler, T., Gröttrup, S. Data Mining with SPSS Modeler. 2016.


Studijní plány, ve kterých se předmět nachází
Fakulta Studijní plán (Verze) Kategorie studijního oboru/specializace Doporučený ročník Doporučený semestr