Diplomová práce se zabývá návrhem modelu pro klasifikaci dat z naměřených hodnot chybových stavů virtuálního webového serveru Portal a databázového serveru Oracle Univerzity Pardubice. Cílem předložené práce je sestavení modelu, který s maximální možnou přesností klasifikuje data do tříd, které reprezentují možné chybové stavy serverů.
Klasifikace je provedena metodou učení s učitelem pomocí neuronových sítí typu SVM. Tato diplomová práce je rozdělena do dvou základních částí. V první části jsou charakterizovány základní pojmy a metody virtualizace. Dále jsou definovány základní pojmy neuronových sítí a metody jejich učení. Další kapitola se zabývá základními principy metody strojového učení Support Vector Machine.
Druhá praktická část této práce je věnována návrhu struktury modelu klasifikace. Na začátku této části je popsána analýza a předzpracování poskytnutých dat. Poté následuje návrh několika možných struktur modelu, na kterých jsou prováděny experimenty, jejichž cílem je výběr nejvhodnějších parametrů klasifikátoru. K těmto experimentům bylo využito programového prostředí WEKA. Závěrečná kapitola analyzuje dosažené výsledky klasifikace nejvhodnějšího modelu navrženého pomocí SVM.
Anotace v angličtině
This thesis describes the design of model for data classification from measured values of error states virtual Portal web server and database server Oracle to University of Pardubice. The aim of this work is to build a model with the greatest possible accuracy classifies data into classes that represent the possible error conditions servers.
Classification is performed by supervised learning, using neural networks like SVM. This thesis is divided into two parts. In the first part are characterized by basic concepts and methods of virtualization. Further defines the basic concepts of neural networks and methods of teaching. The next chapter deals with the basic principles of machine learning methods Support Vector Machine.
The second part of this work is devoted to the design of the model structure classification. At the beginning of this section describes the analysis and preprocessing of data provided. This is followed by the design of several possible structures of the model on which they are carried out experiments aimed at identifying the most suitable parameter classifier. These experiments were used programming environment WEKA. The final chapter analyzes the results obtained the best classification model proposed by SVM.
Diplomová práce se zabývá návrhem modelu pro klasifikaci dat z naměřených hodnot chybových stavů virtuálního webového serveru Portal a databázového serveru Oracle Univerzity Pardubice. Cílem předložené práce je sestavení modelu, který s maximální možnou přesností klasifikuje data do tříd, které reprezentují možné chybové stavy serverů.
Klasifikace je provedena metodou učení s učitelem pomocí neuronových sítí typu SVM. Tato diplomová práce je rozdělena do dvou základních částí. V první části jsou charakterizovány základní pojmy a metody virtualizace. Dále jsou definovány základní pojmy neuronových sítí a metody jejich učení. Další kapitola se zabývá základními principy metody strojového učení Support Vector Machine.
Druhá praktická část této práce je věnována návrhu struktury modelu klasifikace. Na začátku této části je popsána analýza a předzpracování poskytnutých dat. Poté následuje návrh několika možných struktur modelu, na kterých jsou prováděny experimenty, jejichž cílem je výběr nejvhodnějších parametrů klasifikátoru. K těmto experimentům bylo využito programového prostředí WEKA. Závěrečná kapitola analyzuje dosažené výsledky klasifikace nejvhodnějšího modelu navrženého pomocí SVM.
Anotace v angličtině
This thesis describes the design of model for data classification from measured values of error states virtual Portal web server and database server Oracle to University of Pardubice. The aim of this work is to build a model with the greatest possible accuracy classifies data into classes that represent the possible error conditions servers.
Classification is performed by supervised learning, using neural networks like SVM. This thesis is divided into two parts. In the first part are characterized by basic concepts and methods of virtualization. Further defines the basic concepts of neural networks and methods of teaching. The next chapter deals with the basic principles of machine learning methods Support Vector Machine.
The second part of this work is devoted to the design of the model structure classification. At the beginning of this section describes the analysis and preprocessing of data provided. This is followed by the design of several possible structures of the model on which they are carried out experiments aimed at identifying the most suitable parameter classifier. These experiments were used programming environment WEKA. The final chapter analyzes the results obtained the best classification model proposed by SVM.
Analyzovat data virtuálního serveru.
Charakterizovat SVM.
Navrhnout model na klasifikaci.
Verifikovat navrhnutý model.
Uskutečnit analýzu výsledků.
Zásady pro vypracování
Analyzovat data virtuálního serveru.
Charakterizovat SVM.
Navrhnout model na klasifikaci.
Verifikovat navrhnutý model.
Uskutečnit analýzu výsledků.
Seznam doporučené literatury
Cristianini, N.; Shawe-Taylor, J.: Introduction to Support Vector Machines and other Kernel-based Learning Methods. Cambridge University Press, Cambridge (2000)
Haykin, S.: Neural Networks: A Comprehensive Foundation. Prentice-Hall Inc., New Jersey (1999)
Kvasnička, V. at al.: Introduction to Neural Networks. Iris, Bratislava (1997) (in Slovak)
Abe, S.: Support Vector Machines for Pattern Classification. Springer-Verlag, London (2005)
Cristianini, N., Shawe-Taylor, J.: An Introduction to Support Vector Machines and other Kernel-based Learning Methods. Cambridge University Press, Cambridge (2000)
Hájek, P.; Olej, V.: Municipal Creditworthiness Modelling by Kernel-based Approaches with Supervised and Semi-supervised Learning. Proc. of the 11th International Conference on Engineering Applications of Neural Networks, EANN 2009, Communications in Computer and Information Science, Engineering Applications of Neural Networks, London, Palmer-Brown, D., Draganova, Ch., Pimenidis, E., Mouratidis, H., Eds., 27-29 august, Springer Berlin Heidelberg New York, 2009, pp.35-44.
Seznam doporučené literatury
Cristianini, N.; Shawe-Taylor, J.: Introduction to Support Vector Machines and other Kernel-based Learning Methods. Cambridge University Press, Cambridge (2000)
Haykin, S.: Neural Networks: A Comprehensive Foundation. Prentice-Hall Inc., New Jersey (1999)
Kvasnička, V. at al.: Introduction to Neural Networks. Iris, Bratislava (1997) (in Slovak)
Abe, S.: Support Vector Machines for Pattern Classification. Springer-Verlag, London (2005)
Cristianini, N., Shawe-Taylor, J.: An Introduction to Support Vector Machines and other Kernel-based Learning Methods. Cambridge University Press, Cambridge (2000)
Hájek, P.; Olej, V.: Municipal Creditworthiness Modelling by Kernel-based Approaches with Supervised and Semi-supervised Learning. Proc. of the 11th International Conference on Engineering Applications of Neural Networks, EANN 2009, Communications in Computer and Information Science, Engineering Applications of Neural Networks, London, Palmer-Brown, D., Draganova, Ch., Pimenidis, E., Mouratidis, H., Eds., 27-29 august, Springer Berlin Heidelberg New York, 2009, pp.35-44.
Přílohy volně vložené
-
Přílohy vázané v práci
-
Převzato z knihovny
Ne
Plný text práce
Přílohy
Posudek(y) oponenta
Hodnocení vedoucího
Záznam průběhu obhajoby
Student představil komisi výsledky diplomové práce na téma Modelování dat charakterizující virtuální server pomocí SVM, prezentoval postup řešení a výstupy své práce. Na otázky odpovídal pohotově: Objasněte důvod pro určení počtu segmentu 10 v části předzpracování. Vysvětlete, proč jste nepoužil dělení dat na trénovací, testovací a validační množinu. Vysvětlete redukci datové matice z 42000 záznamů na 206. Popište, co jsou parametry C, N, L v tabulce 5. Proč je vztah tak složitý? Jak se tok ovlivní, když dojde k chybě? Byla korelace vysoká?