Diplomová práce se zabývá problematikou detekce finančních podvodů metodami strojového učení. Základní koncept pojednání je situován do čtyř hlavních oblastí, a sice kdy jsou v první části shrnuty základní problematiky finančních podvodů z hlediska pojmů, dělení, preventivních opatření a detekčních technik. Druhá část je zaměřena na shrnutí výsledků z reportu SEC z roku 2010-2015 a třetí část na teoretické základy strojového učení a vybrané algoritmy. Poslední část práce je věnována popisu sběru dat a jejich přípravě k měření, přičemž v poslední kapitole jsou získané výsledky porovnány a statisticky vyhodnoceny.
Anotace v angličtině
This Master's thesis deals with the issue of detection of financial frauds by machine learning. The basic concept of the treatise is situated in four main areas, although the first part summarizes the basic problems of financial frauds in terms of concepts, divisions, preventive measures and detection techniques. The other part is focused on summarizing the results from the SEC report from 2010-2015 and the final part on the theoretical foundations of machine learning and selected algorithms. The final part of the thesis is devoted to the description of data collection and its preparation for measurement, whereas in the last chapter are the obtained results compared and statistically evaluated.
Klíčová slova
strojové učení, finanční podvody, detekce, finanční výkazy, firmy
Diplomová práce se zabývá problematikou detekce finančních podvodů metodami strojového učení. Základní koncept pojednání je situován do čtyř hlavních oblastí, a sice kdy jsou v první části shrnuty základní problematiky finančních podvodů z hlediska pojmů, dělení, preventivních opatření a detekčních technik. Druhá část je zaměřena na shrnutí výsledků z reportu SEC z roku 2010-2015 a třetí část na teoretické základy strojového učení a vybrané algoritmy. Poslední část práce je věnována popisu sběru dat a jejich přípravě k měření, přičemž v poslední kapitole jsou získané výsledky porovnány a statisticky vyhodnoceny.
Anotace v angličtině
This Master's thesis deals with the issue of detection of financial frauds by machine learning. The basic concept of the treatise is situated in four main areas, although the first part summarizes the basic problems of financial frauds in terms of concepts, divisions, preventive measures and detection techniques. The other part is focused on summarizing the results from the SEC report from 2010-2015 and the final part on the theoretical foundations of machine learning and selected algorithms. The final part of the thesis is devoted to the description of data collection and its preparation for measurement, whereas in the last chapter are the obtained results compared and statistically evaluated.
Klíčová slova
strojové učení, finanční podvody, detekce, finanční výkazy, firmy
Cílem práce pro detekci finančních podvodů metodami strojového učení je zabezpečení sběru dat, popis získaných dat, charakteristika vybrané metody strojového učení, navržení modelu pro detekci finančních podvodů, jeho verifikace a provedení porovnání výsledků zvolených metod.
Osnova:
- Sběr a předzpracování dat
- Charakteristika vybrané metody strojového učení
- Navržení modelu pro detekci finančních podvodů
- Verifikace, porovnání výsledků zvolených metod
Zásady pro vypracování
Cílem práce pro detekci finančních podvodů metodami strojového učení je zabezpečení sběru dat, popis získaných dat, charakteristika vybrané metody strojového učení, navržení modelu pro detekci finančních podvodů, jeho verifikace a provedení porovnání výsledků zvolených metod.
Osnova:
- Sběr a předzpracování dat
- Charakteristika vybrané metody strojového učení
- Navržení modelu pro detekci finančních podvodů
- Verifikace, porovnání výsledků zvolených metod
Seznam doporučené literatury
[1] WITTEN, I.H., FRANK, E., HALL, M.A. Data Mining: Practical Machine Learning Tools and Techniques. Amsterdam: Morgan Kaufmann, 2011. 665 s. ISBN 978-0-12-374856-0.
[2] ALPAYDIN, E. Introduction to Machine Learning. London: MIT Press, 2009. 579 s. ISBN 978-0-262-01243-0.
[3] MITCHELL, T. Machine Learning. New York: McGraw-Hill, 1997. 432 s. ISBN 0070428077.
[4] WEISS, S. M., INDURKHYA, N., ZHANG, T. Fundamentals of Predictive Text Mining. New York: Springer, 2010. 226 s. ISBN 978-1849962254.
[5] MINER, G. Practical Text Mining and Statistical Analysis for Non-structured Text Data Applications. Amsterdam: Elsevier, 2012. 1000 s. ISBN 978-0-12-3870117.
Seznam doporučené literatury
[1] WITTEN, I.H., FRANK, E., HALL, M.A. Data Mining: Practical Machine Learning Tools and Techniques. Amsterdam: Morgan Kaufmann, 2011. 665 s. ISBN 978-0-12-374856-0.
[2] ALPAYDIN, E. Introduction to Machine Learning. London: MIT Press, 2009. 579 s. ISBN 978-0-262-01243-0.
[3] MITCHELL, T. Machine Learning. New York: McGraw-Hill, 1997. 432 s. ISBN 0070428077.
[4] WEISS, S. M., INDURKHYA, N., ZHANG, T. Fundamentals of Predictive Text Mining. New York: Springer, 2010. 226 s. ISBN 978-1849962254.
[5] MINER, G. Practical Text Mining and Statistical Analysis for Non-structured Text Data Applications. Amsterdam: Elsevier, 2012. 1000 s. ISBN 978-0-12-3870117.
Přílohy volně vložené
-
Přílohy vázané v práci
ilustrace, grafy, tabulky
Převzato z knihovny
Ne
Plný text práce
Přílohy
Posudek(y) oponenta
Hodnocení vedoucího
Záznam průběhu obhajoby
Studentka seznámila komisi s tématem své diplomové práce.\par
Komise položila otázky: Lze váš model použít i v jiném ekonomickém prostředí, aniž by nebyl přeučen? Zdůvodněte. \par
Studentka na otázku odpověděla. \par \par\par\par\par \par\par\par