AI doporučení judikátů
Cílem práce je otestovat schopnosti pgvector pro vyhledávání relevantních judikátů. Nejprve nalezněte vhodný embedding model a dále jej dotrénujte na judikatuře Nejvyššího soudu a Ústavního soudu.
Vyvinete vyhledávač umožňující hledání podobných pasáží v rozhodnutích pomocí různých přístupů a modelů. Pro vybrané přístupy navrhněte vhodné metriky a systematicky je otestujte. Práce může využít existující data z ODL projektu RoboJudge.
Zdroje:
Analýza emisí
Práce se zaměří na zpracování a analýzu datasetu obsahujícího výsledky měření emisí dopravních prostředků, které byly získány od Ministerstva dopravy na základě zákona o svobodném přístupu k informacím.
Hlavním cílem je identifikace trendů, odhalení anomálií a formulace doporučení pro veřejnou správu. Součástí bude také vizualizace dat a případné predikce budoucího vývoje emisí.
Inspirace:
Hashování kalendáře pomoci emoji
Vyvážení pracovního a osobního života vyžaduje efektivní plánování času, ale pracovní kalendář často obsahuje citlivé informace, které nelze jednoduše sdílet.
Cílem práce je navrhnout, implementovat a otestovat řešení, které transformuje kalendář ve formátu iCal do podoby, kde budou názvy událostí nahrazeny vhodnými emotikony. Aplikace by zároveň měla umožňovat přizpůsobení pomocí uživatelského slovníku a využít vhodné jazykové nástroje / embeddingy.
Zdroje:
Vizualizace měření na mapě
Práce se zaměří na návrh a implementaci aplikace pro vizualizaci statistických datových bodů na mapě. Jako příklad použití lze zvolit měření dostupnosti internetu při opakovaných cestách vlakem po stejné trase.
Aplikace by měla využívat existující knihovny pro mapovou vizualizaci a umožnit uživatelskou kontribuci nových měření. Důraz bude kladen na přehlednost zobrazení a efektivní kontrolu kontribuovaných dat.
Léková data z pohledu znalostního inženýra
Cílem práce je podrobná analýza a následná vizualizace dat ze systému eRecept a údajů SÚKLu z pohledu výdeje a dostupnosti léků. Práce by měla vhodně navázat na existující práci v ODL, která se tomuto tématu věnuje a rozšířit jí o pokročilé analýzy trendů ve vydávání léků a predikce jejich dostupnosti.
Zdroje:
Radar veřejné dopravy
Ministerstvo dopravy začalo v nedávné době zveřejňovat data z Celostátního informačního systému o jízdních řádech. Cílem práce je automaticky zpracovávat tato data a vytvořit mapu, která je bude zobrazovat. Aplikace by měla ukazovat spoje MHD, autobusy a vlaky v poloze podle jízdního řádu na mapě, obdobně jako to dělá Flight radar nebo Mapa PIDu. Práce nemusí pro jednoduchost uvažovat zpoždění spojů.
Zdroje:
Jak do práce?
Existuje větší množství iniciativ, které se snaží snížit využití individuální dopravy, motivovat k jízdě na kole a motivovat k využití MHD. Jak ale tyto aktivity jsou úspěšné a co ovlivňuje chování jednotlivých skupin?
Analyzujte data z běžných otevřených zdrojů o cyklistice, veřejné a iniciální dopravě a porovnejte jejich změny v proběhu dne a týdne v závislosti na počasí a teplotě. Je možné detekovat korelaci / přelivy mezi jednotlivými způsoby dopravy?
Zdroje:
Simulátor mimořádností MHD
PID poskytuje velké množství otevřených dat. Existuje více aplikací, které umožňují plánovat spojení se zohledněním známých mimořádných situací, ale v současné době neexistuje snadná cesta, jak plánovat trasu s vyloučením některého úseku. Vytvořit přesnou simulaci takového vyloučeného úseku je obtížné, protože do hry vstupuje i operativní řízení dispečinku, které může trasu linek upravovat a vliv individuální dopravy. Na druhou stranu jsou různé řešení omezena u kolejové dopravy.
Práci lze proto zacílit do dvou směrů:
- Analýza dopadu vyloučených úseků pro okolní linky. Nechť vyloučíme některý úsek tramvajové sítě (např. Malostranském náměstí), jaké bude očekáváné zpoždění u dotčených linek. Jak tyto odklony ovlivní zpoždění u linek v okolí? Jak daleko se toto zpoždění bude distribuovat (zobrazte například pomocí heat mapy). Jak zpoždění bude ovlivněno v průběhu dne a týdne?
- Vytvořte aplikaci, která umožní vyhledávat optimální spojení s nastaveným penalizace (např nastaveným zpožděním) a vyloučením (např. překážka / kolona) na trase.
Zdroje:
ISIR v2.0
Cílem práce je obnovit náš projekt pro zpracování insolvencí v ČR a přidat do něj nové funkcionality. Projekt IsirExplorer je určen veřejnosti a poskytuje přehled o stavu insolvenčních procesů. Aktuální verze projektu zpracovává starý formát dat, v současné době se ale zveřejňují jednotlivé insolvence v jiném formátu. Při aktualizaci projektu je vhodné doplnit automatické získávání dat a přidat zpracovávání délky trvání jednotlivých insolvencí.
Webová stránka projektu: https://isir-explorer.opendatalab.cz
CzechCaptcha
Cílem práce je vytvořit frontendovou část pro existující aplikaci opensource Captcha (tj. pro systém pro reverzní Turingův test). Backend a databáze aplikace jsou k dispozici z předešlých studentských prací.
Dalším cílem práce může být také vytvořit metriky pro rozpoznání člověka od robota.