Zadání

Sbírka listin

Cílem je spravovat, kategorizovat a analyzovat pdf soubory obsahující sbírky listin. V práci je vhodné využít existující nástroje pro OCR a textovou klasifikaci. Zajímavé údaje jsou jednotlivé finanční ukazatele, tvůrce auditu, vyjmenované osoby v daných dokumentech.

Vstupem je IČ firmy a výsledkem je report, včetně toho, jestli firma plní zákonnou povinnost zveřejňování výsledků.

https://or.justice.cz/ias/ui/vypis-sl-firma?subjektId=910176

Cachování LLM odpovědí

Cílem práce je analyzovat současné přístupy ke snížení počtu placených volání LLM modelů u opakovaných diskuzí na stejné téma pomocí cachování odpovědí z jazykových modelů (LLM) a word-embeddingů s důrazem na zrychlení LLM-based aplikací a snížení provozních nákladů. Dále bude navržen a implementován vlastní přístup k cachování s využitím různých GPT modelů.