Zadání

Egidio | platforma pro řešení katastrof

Na Zemi se děje mnoho katastrof. Stále dokola se řeší, jak nabízet pomoc, jak ji přijmout, jak o ní napsat.

Cílem je navrhnout a implementovat cloudovou platformu, ve které bude možné uživatelsky přívětivě nabídnout pomoc, napsat si o pomoc a také ji organizovat. Bude možné vytvořit „katastrofu“ (projekt) a povolit určité typy pomoci. Bude možné zápisy sdílet na sociálních sítích a nabízející budou moci řídit úroveň zveřejněných osobních údajů. U „běžných“ katastrof bude dostupný template toho, co je potřeba. Například povodně – vysoušeče, ubytování, peníze, čerpadla…

Robojudge

Soudní rozsudky budou od 07/2022 veřejně dostupné na adrese: https://rozhodnuti.justice.cz/

Cílem práce je vytvořit robosoudce, který na základě popisu skutku odhadne výsledek sporu. Součástí bude i klasifikace rozsudků a vytěžení klíčových příznaků relevantních pro rozhodnutí.

Detekce anonymizovaných oblastí ve smlouvách v registru smluv

Cílem je v zadaném pdf spočítat začerněnou plochu – může být buď začerněna, zaplněna zrněním, případně zabílena s komentářem.

Zpracování textu z registru smluv

Cílem je vyřešit jednu z úloh nutných pro získání jednotkových cen ze smluv uveřejněných v registru smluv. První úlohou je určení správné kategorie smlouvy a zjištění jejího předmětu. Další je extrakce konkrétních jednotkových cen a kupovaných věcí, třetí je detailnější analýza smluv.

Zadání bude řešeno ve spolupráci s hlidacstatu.cz

Sbírka listin

Cílem je spravovat, kategorizovat a analyzovat pdf soubory obsahující sbírky listin. V práci je vhodné využít existující nástroje pro OCR a textovou klasifikaci. Zajímavé údaje jsou jednotlivé finanční ukazatele, tvůrce auditu, vyjmenované osoby v daných dokumentech.

Vstupem je IČ firmy a výsledkem je report, včetně toho, jestli firma plní zákonnou povinnost zveřejňování výsledků.

https://or.justice.cz/ias/ui/vypis-sl-firma?subjektId=910176

Analýza transperetní účtů

Cílem je analyzovat strukturovaná data o transparentních účtech na webech největších bank (5). Cílem je sledovat opakující se platby, případně extrahovat kdo komu kolik přispěl v daném období a vhodně tyto informace vizualizovat v čase. Motivací pro tuto práci jsou výdaje politických stran před volbami.

Nástroj by měl jako vstup vzít adresu transparentního účtu, načež provede zpracování dat asynchronně a výsledek analýzy následně přehledně zobrazí formou webové stránky. Data budou dostupná v otevřeném formátu.

Budget quiz

Cílem je vytvořit komplexní kvízovou aplikaci pro simulování státního rozpočtu. Uživatel aplikace zodpoví několik otázek, pomocí kterých nastaví parametry státního rozpočtu. Součástí práce je statistická analýza výsledků kvízu z uživatelského testování.

Je možné inspirovat se, případně rozšířit existující práci https://dspace.cvut.cz/handle/10467/102208.

Analyzátor uniklých datasetů

Práce si klade za cíl vytvořit analyzátor uniklých datasetů (Anonymous Leaks, Panama Papers…). Nástroj by měl umožňovat spravovat metadata, automaticky určovat kategorii dokumentů, jazyk, kterým jsou psány, a různé jejich vlastnosti (autor, GPS etc.) za použití existujících nástrojů pro OCR a klasifikaci textu.

Variantou je úprava stávajícího nástroje Aleph od OCCRP (https://github.com/alephdata/aleph), aby podporoval chybějící části a nabídl přehledné workflow.

Analyzátor výherců veřejných zakázek

Cílem je vytvořit webovou aplikaci – analyzátor veřejných zakázek, který umožní vyhledávat jednotlivé zadavatele veřejných zakázek a jejich výherce pomocí mapy. Případně dokáže zobrazit tyto skupiny pro určitou oblast. Údaje budou přehledně prezentovány a budou provedeny agregace přes určené časové období, tedy nejen počet zakázek.

Možným rozšířením je vytvořit model pro predikování budoucích vítězů. Data budou brána z registru smluv, profilů zadavatelů a případně hlídače státu.

Odezírání

Práce si klade za cíl vytvořit model, který bude schopný generovat textový přepis lidské řeči pomocí odezírání z úst ve videu beze zvuku. Model by měl cílit na český jazyk a pro trénování může využít filmy s titulky nebo televizní vysílání s titulky. Práce je vhodná pro diplomou práci.

Zdroje: