Přijímačky v datech
Jednotné přijímací zkoušky a systém rozřazování podle preferencí škol spolu s omezenou kapacitou nejžádanějších oborů vedou k tomu, že se přijímací řízení stále více stává strategickou volbou. Cílem práce je zpracovat a analyzovat data z CERMATu (případně doplněná o další veřejné zdroje) a prezentovat je v přehledné podobě tak, aby uchazeči měli k dispozici informace pro kvalifikované rozhodování o volbě škol a jejich pořadí. Dle zaměření studenta se práce může více soustředit na provázání se souvisejícími datovými zdroji, analýzu historických trendů, vizualizaci dat, nebo návrh jednoduchého doporučovacího systému pro výběr škol.
Zdroje:
15min město
Koncept „15minutového města“ předpokládá, že základní služby by měly být dostupné do 15 minut chůze nebo jízdy na kole. Cílem práce je vytvořit datově orientovaný přístup k vyhodnocení dostupnosti služeb ve vybraném městě s využitím otevřených nebo scrapovaných dat. Podle zaměření studující/ho může práce klást důraz na sběr dat, geospaciální zpracování, vizualizaci dostupnosti, nebo statistickou analýzu a modelování vzorců dostupnosti služeb.
Inspirace:
Job Analyzer
Cílem práce je vytvořit datově orientovaný přehled pracovního trhu na základě dat získaných z pracovních portálů (např. pomocí scrapingu nebo veřejných API). Práce by měla zpracovat a analyzovat informace o nabízených pozicích – například obor, lokalita, typ úvazku, požadavky, benefity či mzda – a prezentovat je pomocí přehledných statistik a vizualizací, včetně sledování trendů v čase. Dle zaměření studenta může práce zahrnovat také propojení s dalšími datovými zdroji (např. nezaměstnanost), vytvoření modelu pro odhad mzdy nebo analýzu podobnosti pracovních pozic.
Inspirace:
Výstavba dle OpenStreetMap
Cílem práce je vytvoření otevřených dat, která umožní sledovat vývoj výstavby a změny charakteristik budov ve vybrané lokalitě na základě dat z OpenStreetMap. Studující zpracuje prostorové změny v čase a navrhne způsob jejich reprezentace, například formou mapy doplněné o analýzu rychlosti výstavby, typologie budov apod. Práce může být dále rozšířena o propojení s dalšími veřejně dostupnými daty (např. demografickými údaji, údaji o politické reprezentaci) a statistické zhodnocení jejich vztahu k výstavbě.
Zdroje:
Zprávy ČŠI
Cílem práce je zpracování zpráv České školní inspekce. Základem bude vytěžení těchto zpráv (ve formátu PDF), například s využitím moderních AI nástrojů. V návaznosti na zaměření studujícího může práce dále zahrnovat vytvoření aplikace umožňující uživateli dotazovat se na vytěžená data (např. porovnávat vybrané školy, sledovat změny v čase), jejich vizualizaci prostřednictvím grafů a map, nebo analýzu souvislostí s demografickými údaji (např. hustota zalidnění, věková struktura obyvatel apod.).
Zdroje:
AI doporučení judikátů
Cílem práce je otestovat schopnosti pgvector pro vyhledávání relevantních judikátů. Nejprve nalezněte vhodný embedding model a dále jej dotrénujte na judikatuře Nejvyššího soudu a Ústavního soudu.
Vyvinete vyhledávač umožňující hledání podobných pasáží v rozhodnutích pomocí různých přístupů a modelů. Pro vybrané přístupy navrhněte vhodné metriky a systematicky je otestujte. Práce může využít existující data z ODL projektu RoboJudge.
Zdroje:
Léková data z pohledu znalostního inženýra
Cílem práce je podrobná analýza a následná vizualizace dat ze systému eRecept a údajů SÚKLu z pohledu výdeje a dostupnosti léků. Práce by měla vhodně navázat na existující práci v ODL, která se tomuto tématu věnuje a rozšířit jí o pokročilé analýzy trendů ve vydávání léků a predikce jejich dostupnosti.
Zdroje:
ISIR v2.0
Cílem práce je obnovit náš projekt pro zpracování insolvencí v ČR a přidat do něj nové funkcionality. Projekt IsirExplorer je určen veřejnosti a poskytuje přehled o stavu insolvenčních procesů. Aktuální verze projektu zpracovává starý formát dat, v současné době se ale zveřejňují jednotlivé insolvence v jiném formátu. Při aktualizaci projektu je vhodné doplnit automatické získávání dat a přidat zpracovávání délky trvání jednotlivých insolvencí.
Webová stránka projektu: https://isir-explorer.opendatalab.cz
CzechCaptcha
Cílem práce je vytvořit frontendovou část pro existující aplikaci opensource Captcha (tj. pro systém pro reverzní Turingův test). Backend a databáze aplikace jsou k dispozici z předešlých studentských prací.
Dalším cílem práce může být také vytvořit metriky pro rozpoznání člověka od robota.