Vyučující
|
-
Hájek Petr, prof. Ing. Ph.D.
|
Obsah předmětu
|
Úloha a vlastnosti nestrukturovaných dat Možnosti vytváření invertovaných indexů Slovníkové modely Statistické přístupy k extrakci z nestrukturovaných dat Získávání relací z nestrukturovaných dat Sémantické anotování a ontologie Extrakce vizuální a textové informace z obrazu Modely pro vyhledávání informací a obrazu Modely automatického rozpoznávání řeči Hodnocení kvality zpracování nestrukturovaných dat
|
Studijní aktivity a metody výuky
|
Monologická (výklad, přednáška, instruktáž), Dialogická (diskuze, rozhovor, brainstorming), Metody práce s textem (učebnicí, knihou), Metody samostatných akcí, Laborování
|
Výstupy z učení
|
Cílem předmětu je seznámit studenty jak se základními metodami zpracování nestrukturovaných dat, zejména textových dokumentů, obrazu a zvuku. Výsledkem tohoto zpracování jsou data ve strukturované nebo alespoň částečně strukturované formě, která umožňuje další analýzy, včetně jejich vizualizace a objevování znalostí.
Po absolvování předmětu by měl student rozumět teoretickým i praktickým aspektům předzpracování nestrukturovaných dat a možnostem vyhledávání informací v těchto datech. Měli by také být schopni navrhnout systém pro automatické zpracování nestrukturovaných dat.
|
Předpoklady
|
Práce na PC a základní znalosti práce s produktem MS Excel.
|
Hodnoticí metody a kritéria
|
Ústní zkouška, Systematické pozorování
Zápočet: Zpracování zadaných úloh s minimálně 60% úspěšností. Úspěšné obhájení praktického projektu, při němž student prokáže schopnost aplikovat získané teoretické znalosti. Projekt bude zahrnovat návrh systému pro automatické zpracování zvolené množiny nestrukturovaných dat. Zkouška: ústní zkouška.
|
Doporučená literatura
|
-
AUGER, A., BARRI?RE, C. Pattern-based Approaches to Semantic Relation Extraction: A State-of-the-art.. 2008.
-
BOULTON, D., HAMMERSLEY, M. Analysis of Unstructured Data. London, 2006.
-
DATTA, R., JOSHI, D., LI, J., WANG, J. Z. Image Retrieval: Ideas, Influences, and Trends of the New Age. 2008.
-
GRIMM, M., KROSCHEL, K. Robust Speech Recognition and Understanding. Vienna, 2007.
-
HEATH, T., BIZER, CH. Linked Data: Evolving the Web into a Global Data Space. 2011.
-
MANNING, C. D. Foundations of Statistical Natural Language Processing. Cambridge, 1999.
-
MANNING, CH. D., RAGHAVAN, P., SCHUTZE, H. Introduction to Information Retrieval. New York, 2008.
-
MINER, G. Practical Text Mining and Statistical Analysis for Non-structured Text Data Applications. Amsterdam, 2012.
|