Cílem bakalářské práce bylo vypracovat podklady pro předmět PZDM a popsat problematiku data miningu od přípravy dat do konečných výstupů se zaměřením na shlukovou analýzu. Teoretická část zahrnuje seznámení s termínem data mining a popisuje principy vybraných
metod shlukové analýzy. Práce uvádí v praktické části příklad zpracování datového souboru prostřednictvím shlukové analýzy v softwarovém prostředí Clementine. Data miningový proces postupuje dle metodologie CRISP - DM.
Anotace v angličtině
The aim of the thesis was to elaborate documents for the seminar of the subject PZDM and describe the problems of data mining in terms of cluster analysis from data preparation to the final outputs. The theoretical part describes the principles of some selected methods of cluster analysis and there is one example from the data file elaborated in Clementine software environment in the practical part of the thesis. Data mining process follow the methodology of CRISP - DM.
Klíčová slova
Data mining, metodika CRISP-DM, shluková analýza, shlukování dat, analýza shluků, analýza dat
Klíčová slova v angličtině
Data mining, CRISP ? DM metodology, cluster analysis, clustering,data analysis
Rozsah průvodní práce
-
Jazyk
CZ
Anotace
Cílem bakalářské práce bylo vypracovat podklady pro předmět PZDM a popsat problematiku data miningu od přípravy dat do konečných výstupů se zaměřením na shlukovou analýzu. Teoretická část zahrnuje seznámení s termínem data mining a popisuje principy vybraných
metod shlukové analýzy. Práce uvádí v praktické části příklad zpracování datového souboru prostřednictvím shlukové analýzy v softwarovém prostředí Clementine. Data miningový proces postupuje dle metodologie CRISP - DM.
Anotace v angličtině
The aim of the thesis was to elaborate documents for the seminar of the subject PZDM and describe the problems of data mining in terms of cluster analysis from data preparation to the final outputs. The theoretical part describes the principles of some selected methods of cluster analysis and there is one example from the data file elaborated in Clementine software environment in the practical part of the thesis. Data mining process follow the methodology of CRISP - DM.
Klíčová slova
Data mining, metodika CRISP-DM, shluková analýza, shlukování dat, analýza shluků, analýza dat
Klíčová slova v angličtině
Data mining, CRISP ? DM metodology, cluster analysis, clustering,data analysis
Zásady pro vypracování
1. Data Mining
2. Metodika CRISP-DM
3. Shluková analýza - charakteristika metody
4. Shluková analýza - zpracování konkrétního příkladu v softwarovém prostředí Clementine
Zásady pro vypracování
1. Data Mining
2. Metodika CRISP-DM
3. Shluková analýza - charakteristika metody
4. Shluková analýza - zpracování konkrétního příkladu v softwarovém prostředí Clementine
Seznam doporučené literatury
[1] BERKA, P. Dobývání znalostí z databází. Praha: Academia, 2003, 366 s. ISBN 80-200-1062-9.
[2] RUD, O.L. Data Mining: Praktický průvodce dolováním dat pro efektivní prodej, cílený marketing a podporu zákazníků (CRM). Praha: Computer Press, 2001, 329 s. ISBN 80-7226-577-6.
[3] ŘEZÁNKOVÁ, H., HÚSEK, D., SNÁŠEL, V. Shluková analýza dat. Praha: Professional Publishing, 2009, 220 s. ISBN 978-80-86946-81-8
[4] Step-by-step data mining guide [online]. 1.0. c2000 [cit. 2011-06-27]. CRISP-DM 1.0. Dostupné z WWW: http://community.udayton.edu/
provost/it/training/documents/SPSS_CRISPWPlr.pdf
Seznam doporučené literatury
[1] BERKA, P. Dobývání znalostí z databází. Praha: Academia, 2003, 366 s. ISBN 80-200-1062-9.
[2] RUD, O.L. Data Mining: Praktický průvodce dolováním dat pro efektivní prodej, cílený marketing a podporu zákazníků (CRM). Praha: Computer Press, 2001, 329 s. ISBN 80-7226-577-6.
[3] ŘEZÁNKOVÁ, H., HÚSEK, D., SNÁŠEL, V. Shluková analýza dat. Praha: Professional Publishing, 2009, 220 s. ISBN 978-80-86946-81-8
[4] Step-by-step data mining guide [online]. 1.0. c2000 [cit. 2011-06-27]. CRISP-DM 1.0. Dostupné z WWW: http://community.udayton.edu/
provost/it/training/documents/SPSS_CRISPWPlr.pdf
Přílohy volně vložené
1 CD-ROM
Přílohy vázané v práci
-
Převzato z knihovny
Ne
Plný text práce
Přílohy
Posudek(y) oponenta
Hodnocení vedoucího
Záznam průběhu obhajoby
Studentka práci představila. Komise konstatovala, že cíle práce byly naplněny. Otázky: V jaké podobě dostanou studenti ukázkový příklad? Existují nějaké konkrétní dotace (na ukázkovém příkladu uvedeny dotace)? Proč byla zvolena pouze metody K-MEANS? Proč v práci není standardizace? Dělá algoritmus K-MEANS sám standardizaci a normalizaci? Drobné výtky k neúplnému popisu, proto pochopení studentů.