Předmět: Zpracování nestrukturovaných dat

« Zpět
Název předmětu Zpracování nestrukturovaných dat
Kód předmětu USII/KZND
Organizační forma výuky Přednáška
Úroveň předmětu Magisterský
Rok studia 1
Semestr Letní
Počet ECTS kreditů 4
Vyučovací jazyk Čeština
Statut předmětu Povinně-volitelný
Způsob výuky Kontaktní
Studijní praxe Nejedná se o pracovní stáž
Doporučené volitelné součásti programu Není
Vyučující
  • Hájek Petr, prof. Ing. Ph.D.
Obsah předmětu
Úloha a vlastnosti nestrukturovaných dat Možnosti vytváření invertovaných indexů Slovníkové modely Statistické přístupy k extrakci z nestrukturovaných dat Získávání relací z nestrukturovaných dat Sémantické anotování a ontologie Extrakce vizuální a textové informace z obrazu Modely pro vyhledávání informací a obrazu Modely automatického rozpoznávání řeči Hodnocení kvality zpracování nestrukturovaných dat

Studijní aktivity a metody výuky
Monologická (výklad, přednáška, instruktáž), Dialogická (diskuze, rozhovor, brainstorming), Metody práce s textem (učebnicí, knihou), Metody samostatných akcí, Laborování
Výstupy z učení
Cílem předmětu je seznámit studenty jak se základními metodami zpracování nestrukturovaných dat, zejména textových dokumentů, obrazu a zvuku. Výsledkem tohoto zpracování jsou data ve strukturované nebo alespoň částečně strukturované formě, která umožňuje další analýzy, včetně jejich vizualizace a objevování znalostí.
Po absolvování předmětu by měl student rozumět teoretickým i praktickým aspektům předzpracování nestrukturovaných dat a možnostem vyhledávání informací v těchto datech. Měli by také být schopni navrhnout systém pro automatické zpracování nestrukturovaných dat.
Předpoklady
Práce na PC a základní znalosti práce s produktem MS Excel.

Hodnoticí metody a kritéria
Ústní zkouška, Systematické pozorování

Zápočet: Zpracování zadaných úloh s minimálně 60% úspěšností. Úspěšné obhájení praktického projektu, při němž student prokáže schopnost aplikovat získané teoretické znalosti. Projekt bude zahrnovat návrh systému pro automatické zpracování zvolené množiny nestrukturovaných dat. Zkouška: ústní zkouška.
Doporučená literatura
  • AUGER, A., BARRI?RE, C. Pattern-based Approaches to Semantic Relation Extraction: A State-of-the-art.. 2008.
  • BOULTON, D., HAMMERSLEY, M. Analysis of Unstructured Data. London, 2006.
  • DATTA, R., JOSHI, D., LI, J., WANG, J. Z. Image Retrieval: Ideas, Influences, and Trends of the New Age. 2008.
  • GRIMM, M., KROSCHEL, K. Robust Speech Recognition and Understanding. Vienna, 2007.
  • HEATH, T., BIZER, CH. Linked Data: Evolving the Web into a Global Data Space. 2011.
  • MANNING, C. D. Foundations of Statistical Natural Language Processing. Cambridge, 1999.
  • MANNING, CH. D., RAGHAVAN, P., SCHUTZE, H. Introduction to Information Retrieval. New York, 2008.
  • MINER, G. Practical Text Mining and Statistical Analysis for Non-structured Text Data Applications. Amsterdam, 2012.


Studijní plány, ve kterých se předmět nachází
Fakulta Studijní plán (Verze) Kategorie studijního oboru/specializace Doporučený ročník Doporučený semestr
Fakulta: Fakulta ekonomicko-správní Studijní plán (Verze): Informatika ve veřejné správě (2014) Kategorie: Ekonomie 1 Doporučený ročník:1, Doporučený semestr: Letní