Předmět: Data Mining I

« Zpět
Název předmětu Data Mining I
Kód předmětu USII/FDM1
Organizační forma výuky Přednáška + Cvičení
Úroveň předmětu Bakalářský
Rok studia 3
Semestr Zimní
Počet ECTS kreditů 10
Vyučovací jazyk Čeština
Statut předmětu Povinný
Způsob výuky Kontaktní
Studijní praxe Nejedná se o pracovní stáž
Doporučené volitelné součásti programu Není
Vyučující
  • Šanda Martin, Ing. Ph.D.
  • Kašparová Miloslava, Ing. Ph.D.
Obsah předmětu
Úvod do DM (co je data mining (DM), taxonomie DM metod, příklady využití DM, metodiky atd.) Etapy a úkoly metodologie CRISP-DM (porozumění problému, porozumění datům, příprava dat, modelování, vyhodnocení výsledků, využití výsledků v praxi, hierarchický rozklad CRISP-DM). Porozumění datům (základní pojmy: data, datová matice, závislé a nezávislé proměnné, kódování dat, klasifikace dat, formát datového souboru, datový slovník, základní vizualizace dat, zdroje dat atd.) Příprava dat k modelování (datové manipulace se zaměřením na spojování souborů, výběr záznamů, filtrování, generování odvozených proměnných, agregace, náhrada chybějících hodnot proměnné, využití vybraných statistických metod pro přípravu dat atd.) Základy tvorby modelů pomocí vybraných metod (metody shlukové analýzy, vícenásobné lineární regrese, modely na bázi logistická regrese, využití vybraných algoritmů rozhodovacích stromů atd.) a jejich vyhodnocení.

Studijní aktivity a metody výuky
Monologická (výklad, přednáška, instruktáž), Metody samostatných akcí, Pozorování, Demonstrace
  • Semestrální práce - 100 hodin za semestr
  • Samostatná kritická četba - 15 hodin za semestr
  • Sběr materiálu - 20 hodin za semestr
  • Domácí příprava na výuku - 25 hodin za semestr
  • Příprava na zkoušku - 88 hodin za semestr
  • Kontaktní výuka - 52 hodin za semestr
Výstupy z učení
Cílem předmětu je seznámit studenty s možnostmi data miningu (DM). Na úvodní část navazuje problematika definování cílů a technik pro DM, výběr zdrojů dat a jejich příprava pro modelování, tvorba modelů a jejich vyhodnocení.
Student bude schopen definovat jednotlivé fáze DM projektu a jejich obsah. S využitím sw nástrojů bude umět řešit jednoduché úlohy v oblasti přípravy a dat a vybrat odpovídající metodu pro tvorbu modelu.
Předpoklady
U studenta se předpokládá znalost základů práce s databází v rozsahu předmětu Databázové systémy I (FDS1), základní znalost matematiky, základní zpracování datového souboru v rozsahu předmětu Manažerská informatika I (MFI1) včetně základní úpravy textového souboru v textovém editoru, základní znalost vybraných statistických metod v rozsahu předmětu Počítačové zpracování podnikových dat (FPZD) nebo Pravděpodobnost a statistika (FPAS).

Hodnoticí metody a kritéria
Písemná zkouška, Posouzení zadané práce, Rozbor produktů pracovní činnosti studenta

Požadavky k zápočtu: účast na cvičení (75%), zpracování zadaných úloh na cvičení, odevzdání semestrální práce podle zadání. Požadavky ke zkoušce (včetně formy zkoušky): písemná
Doporučená literatura
  • Berka, Petr. Dobývání znalostí z databází. Praha: Academia, 2003. ISBN 80-200-1062-9.
  • Berry, Michael J. A. Data mining techniques : for marketing, sales, and customer relationship management. Indianapolis: Wiley, 2004. ISBN 0-471-47064-3.
  • Berry, Michael J. A. Mastering data mining. New York: John Wiley & Sons, 2000. ISBN 0-471-33123-6.
  • Petr, Pavel. Data Mining.. Pardubice: Univerzita Pardubice, 2006. ISBN 80-7194-886-1.
  • Petr, Pavel. Metody Data Miningu.. Pardubice: Univerzita Pardubice, 2014. ISBN 978-80-7395-872-5.
  • Petr, Pavel. Metody Data Miningu.. Pardubice: Univerzita Pardubice, 2015. ISBN 978-80-7395-873-2.
  • PYLE, D. Data Preparation for Data Mining. San Diego, Academic Press, 1999, 540 s.. San Diego, 1999.
  • RUD, O. L. Data Mining - Praktický průvodce dolováním dat pro efektivní prodej, cílený marketing a podporu zákazníků (CRM). Praha, Computer Press, 2001, 330 s.. 2001.
  • Wendler, T., Gröttrup, S. Data Mining with SPSS Modeler. 2016.


Studijní plány, ve kterých se předmět nachází
Fakulta Studijní plán (Verze) Kategorie studijního oboru/specializace Doporučený ročník Doporučený semestr