Zadání

Egidio | platforma pro řešení katastrof

Na Zemi se děje mnoho katastrof. Stále dokola se řeší, jak nabízet pomoc, jak ji přijmout, jak o ní napsat.

Cílem je navrhnout a implementovat cloudovou platformu, ve které bude možné uživatelsky přívětivě nabídnout pomoc, napsat si o pomoc a také ji organizovat. Bude možné vytvořit „katastrofu“ (projekt) a povolit určité typy pomoci. Bude možné zápisy sdílet na sociálních sítích a nabízející budou moci řídit úroveň zveřejněných osobních údajů. U „běžných“ katastrof bude dostupný template toho, co je potřeba. Například povodně – vysoušeče, ubytování, peníze, čerpadla…

Robojudge

Soudní rozsudky budou od 07/2022 veřejně dostupné na adrese: https://rozhodnuti.justice.cz/

Cílem práce je vytvořit robosoudce, který na základě popisu skutku odhadne výsledek sporu. Součástí bude i klasifikace rozsudků a vytěžení klíčových příznaků relevantních pro rozhodnutí.

Zpracování textu z registru smluv

Cílem je vyřešit jednu z úloh nutných pro získání jednotkových cen ze smluv uveřejněných v registru smluv. První úlohou je určení správné kategorie smlouvy a zjištění jejího předmětu. Další je extrakce konkrétních jednotkových cen a kupovaných věcí, třetí je detailnější analýza smluv.

Zadání bude řešeno ve spolupráci s hlidacstatu.cz

Sbírka listin

Cílem je spravovat, kategorizovat a analyzovat pdf soubory obsahující sbírky listin. V práci je vhodné využít existující nástroje pro OCR a textovou klasifikaci. Zajímavé údaje jsou jednotlivé finanční ukazatele, tvůrce auditu, vyjmenované osoby v daných dokumentech.

Vstupem je IČ firmy a výsledkem je report, včetně toho, jestli firma plní zákonnou povinnost zveřejňování výsledků.

https://or.justice.cz/ias/ui/vypis-sl-firma?subjektId=910176

Budget quiz

Cílem je vytvořit komplexní kvízovou aplikaci pro simulování státního rozpočtu. Uživatel aplikace zodpoví několik otázek, pomocí kterých nastaví parametry státního rozpočtu. Součástí práce je statistická analýza výsledků kvízu z uživatelského testování.

Je možné inspirovat se, případně rozšířit existující práci https://dspace.cvut.cz/handle/10467/102208.

Analyzátor uniklých datasetů

Práce si klade za cíl vytvořit analyzátor uniklých datasetů (Anonymous Leaks, Panama Papers…). Nástroj by měl umožňovat spravovat metadata, automaticky určovat kategorii dokumentů, jazyk, kterým jsou psány, a různé jejich vlastnosti (autor, GPS etc.) za použití existujících nástrojů pro OCR a klasifikaci textu.

Variantou je úprava stávajícího nástroje Aleph od OCCRP (https://github.com/alephdata/aleph), aby podporoval chybějící části a nabídl přehledné workflow.

Odezírání

Práce si klade za cíl vytvořit model, který bude schopný generovat textový přepis lidské řeči pomocí odezírání z úst ve videu beze zvuku. Model by měl cílit na český jazyk a pro trénování může využít filmy s titulky nebo televizní vysílání s titulky. Práce je vhodná pro diplomou práci.

Zdroje: