| Vyučující | 
    | 
            
                
                    Hájek Petr, prof. Ing. Ph.D.
                 | 
    | Obsah předmětu | 
    | Úloha a vlastnosti nestrukturovaných dat Možnosti vytváření invertovaných indexů Slovníkové modely Statistické přístupy k extrakci z nestrukturovaných dat Získávání relací z nestrukturovaných dat Sémantické anotování a ontologie Extrakce vizuální a textové informace z obrazu Modely pro vyhledávání informací a obrazu Modely automatického rozpoznávání řeči Hodnocení kvality zpracování nestrukturovaných dat 
 
 | 
    | Studijní aktivity a metody výuky | 
    | Monologická (výklad, přednáška, instruktáž), Dialogická (diskuze, rozhovor, brainstorming), Metody práce s textem (učebnicí, knihou), Metody samostatných akcí, Laborování | 
    
    
        
        
            | Výstupy z učení | 
        
            | Cílem předmětu je seznámit studenty jak se základními metodami zpracování nestrukturovaných dat, zejména textových dokumentů, obrazu a zvuku. Výsledkem tohoto zpracování jsou data ve strukturované nebo alespoň částečně strukturované formě, která umožňuje další analýzy, včetně jejich vizualizace a objevování znalostí. Po absolvování předmětu by měl student rozumět teoretickým i praktickým aspektům předzpracování nestrukturovaných dat a možnostem vyhledávání informací v těchto datech. Měli by také být schopni navrhnout systém pro automatické zpracování nestrukturovaných dat.
 
 | 
        
            | Předpoklady | 
        
            | Práce na PC a základní znalosti práce s produktem MS Excel. 
 
 | 
        
            | Hodnoticí metody a kritéria | 
        
            | Ústní zkouška, Systematické pozorování 
 Zápočet:  Zpracování zadaných úloh s minimálně 60% úspěšností. Úspěšné obhájení praktického projektu, při němž student prokáže schopnost aplikovat získané teoretické znalosti. Projekt bude zahrnovat návrh systému pro automatické zpracování zvolené množiny nestrukturovaných dat. Zkouška: ústní zkouška.
 
 | 
    
    | Doporučená literatura | 
    | 
            
                
                
                    AUGER, A., BARRI?RE, C. Pattern-based Approaches to Semantic Relation Extraction: A State-of-the-art.. 2008. 
                
                    BOULTON, D., HAMMERSLEY, M. Analysis of Unstructured Data. London, 2006. 
                
                    DATTA, R., JOSHI, D., LI, J., WANG, J. Z. Image Retrieval: Ideas, Influences, and Trends of the New Age. 2008. 
                
                    GRIMM, M., KROSCHEL, K. Robust Speech Recognition and Understanding. Vienna, 2007. 
                
                    HEATH, T., BIZER, CH. Linked Data: Evolving the Web into a Global Data Space. 2011. 
                
                    MANNING, C. D. Foundations of Statistical Natural Language Processing. Cambridge, 1999. 
                
                    MANNING, CH. D., RAGHAVAN, P., SCHUTZE, H. Introduction to Information Retrieval. New York, 2008. 
                
                    MINER, G. Practical Text Mining and Statistical Analysis for Non-structured Text Data Applications. Amsterdam, 2012. 
                 
 
 |