Tato bakalářská práce se zabývá návrhem a implementací aplikace SaaS pro zpracování dat ze souborů PDF. Cílem práce je tvorba aplikace, která uživatelům umožní efektivně vyhledávat, extrahovat, analyzovat a agregovat informace z více souborů PDF souborů současně. Aplikace bude využívat aplikační programovací rozhraní OpenAI pro zpracování textu a vyhledávání vztahů mezi daty. Součástí závěrečné práce je i analýza stávajících řešení pro zpracování souborů PDF a zaměřuje se na problémy spojené s extrakcí dat a jejich zpracováním.
Annotation in English
This bachelor thesis deals with the design and implementation of a SaaS application for processing data from PDF files. The goal of this thesis is to create an application that allows users to efficiently search, extract, analyze and aggregate information from multiple PDF files simultaneously. The application will use the API of OpenAI for text processing and searching for relationships between data. This thesis includes analysis of existing solutions for processing PDF files and focuses on the challenges associated with data extraction and its processing.
Keywords
Node.js, Angular CLI, PDF, AI, Firebase, analýza obsahu souborů
Keywords in English
Node.js, Angular CLI, PDF, AI, Firebase, analysis of content file
Length of the covering note
75 s. (82 690 znaků)
Language
CZ
Annotation
Tato bakalářská práce se zabývá návrhem a implementací aplikace SaaS pro zpracování dat ze souborů PDF. Cílem práce je tvorba aplikace, která uživatelům umožní efektivně vyhledávat, extrahovat, analyzovat a agregovat informace z více souborů PDF souborů současně. Aplikace bude využívat aplikační programovací rozhraní OpenAI pro zpracování textu a vyhledávání vztahů mezi daty. Součástí závěrečné práce je i analýza stávajících řešení pro zpracování souborů PDF a zaměřuje se na problémy spojené s extrakcí dat a jejich zpracováním.
Annotation in English
This bachelor thesis deals with the design and implementation of a SaaS application for processing data from PDF files. The goal of this thesis is to create an application that allows users to efficiently search, extract, analyze and aggregate information from multiple PDF files simultaneously. The application will use the API of OpenAI for text processing and searching for relationships between data. This thesis includes analysis of existing solutions for processing PDF files and focuses on the challenges associated with data extraction and its processing.
Keywords
Node.js, Angular CLI, PDF, AI, Firebase, analýza obsahu souborů
Keywords in English
Node.js, Angular CLI, PDF, AI, Firebase, analysis of content file
Research Plan
Cílem práce je tvorba aplikace zaměřující se na vyhledání konkrétních dat zároveň ve více PDF souborech a vyhodnocení nalezené množiny dat v kontextu zadaných vstupních podmínek. Řešení má za cíl usnadnit extrakci, analýzu a agregaci informací obsaženývch ve více PDF souborech. Aplikace tak bude také sloužit pro hledání spojitosti a kontextu informací. Součástí závěrečné práce je i analýza současných řešení a jejich konkrétních využití. Předpokládané použité technologie jsou Next.js, React a dále využití API rozhraní AI.
Research Plan
Cílem práce je tvorba aplikace zaměřující se na vyhledání konkrétních dat zároveň ve více PDF souborech a vyhodnocení nalezené množiny dat v kontextu zadaných vstupních podmínek. Řešení má za cíl usnadnit extrakci, analýzu a agregaci informací obsaženývch ve více PDF souborech. Aplikace tak bude také sloužit pro hledání spojitosti a kontextu informací. Součástí závěrečné práce je i analýza současných řešení a jejich konkrétních využití. Předpokládané použité technologie jsou Next.js, React a dále využití API rozhraní AI.
Recommended resources
PENDYALA, V. S. Machine Learning for Societal Improvement, Modernization, and Progress, 2022, Spojené státy americké: IGI Global, ISBN 978-1668440476.
SILGE, J. Text Mining with R: A Tidy Approach, 2017, O'Reilly Media, ISBN 978-1491981658
Recommended resources
PENDYALA, V. S. Machine Learning for Societal Improvement, Modernization, and Progress, 2022, Spojené státy americké: IGI Global, ISBN 978-1668440476.
SILGE, J. Text Mining with R: A Tidy Approach, 2017, O'Reilly Media, ISBN 978-1491981658
Enclosed appendices
-
Appendices bound in thesis
illustrations, tables
Taken from the library
No
Full text of the thesis
Appendices
Reviewer's report
Supervisor's report
Defence procedure record
Bakalářská práce se zabývá tvorbou aplikace zaměřující se na vyhledávání konkrétních dat zároveň ve více PDF souborech a vyhodnocení nalezené množiny dat v kontextu zadaných vstupních podmínek s využitím API rozhraní AI:
Student reagoval na dotazy a připomínky vedoucí práce i členů komise pro státní závěrečné zkoušky.