Výstavba dle OpenStreetMap
Cílem práce je vytvoření otevřených dat, která umožní sledovat vývoj výstavby a změny charakteristik budov ve vybrané lokalitě na základě dat z OpenStreetMap. Studující zpracuje prostorové změny v čase a navrhne způsob jejich reprezentace, například formou mapy doplněné o analýzu rychlosti výstavby, typologie budov apod. Práce může být dále rozšířena o propojení s dalšími veřejně dostupnými daty (např. demografickými údaji, údaji o politické reprezentaci) a statistické zhodnocení jejich vztahu k výstavbě.
Zdroje:
Multimodální modely pro rozpoznávání a popis objektů v reálném čase
Cílem práce je prozkoumat možnosti moderních multimodálních modelů (např. CLIP, GPT-4V, Qwen-VL) pro rozpoznávání a popis objektů z obrazu nebo videa v reálném čase. Student navrhne a implementuje jednoduchý prototyp, experimentálně vyhodnotí přesnost, rychlost a zhodnotí možnosti nasazení v praxi.
Zdroje:
- Radford et al., Learning Transferable Visual Models From Natural Language Supervision (CLIP), ICML 2021.
- Alibaba, Qwen2 & Qwen-VL: A Frontier Multimodal Foundation Model, 2024–2025.
- OpenAI, GPT-4 Technical Report, 2023.
Ceny bydlení
Práce se zaměří na analýzu nabídkových cen nemovitostí a jejich vztahu k vlastnostem samotné nemovitosti (velikost, energetická třída, typ stavby…) i k charakteristikám okolí (např. dopravní dostupnost, intenzita nabídky v lokalitě). Výstupem může být mimo jiné model umožňující odhad obvyklé ceny pro zvolenou nemovitost. Dle zaměření studující/ho se lze orientovat na nájemní či prodejní trh, případně analyzovat i realizované ceny.
Inspirace:
Zprávy ČŠI
Cílem práce je zpracování zpráv České školní inspekce. Základem bude vytěžení těchto zpráv (ve formátu PDF), například s využitím moderních AI nástrojů. V návaznosti na zaměření studujícího může práce dále zahrnovat vytvoření aplikace umožňující uživateli dotazovat se na vytěžená data (např. porovnávat vybrané školy, sledovat změny v čase), jejich vizualizaci prostřednictvím grafů a map, nebo analýzu souvislostí s demografickými údaji (např. hustota zalidnění, věková struktura obyvatel apod.).
Zdroje:
AI doporučení judikátů
Cílem práce je otestovat schopnosti pgvector pro vyhledávání relevantních judikátů. Nejprve nalezněte vhodný embedding model a dále jej dotrénujte na judikatuře Nejvyššího soudu a Ústavního soudu.
Vyvinete vyhledávač umožňující hledání podobných pasáží v rozhodnutích pomocí různých přístupů a modelů. Pro vybrané přístupy navrhněte vhodné metriky a systematicky je otestujte. Práce může využít existující data z ODL projektu RoboJudge.
Zdroje:
Analýza emisí
Práce se zaměří na zpracování a analýzu datasetu obsahujícího výsledky měření emisí dopravních prostředků, které byly získány od Ministerstva dopravy na základě zákona o svobodném přístupu k informacím.
Hlavním cílem je identifikace trendů, odhalení anomálií a formulace doporučení pro veřejnou správu. Součástí bude také vizualizace dat a případné predikce budoucího vývoje emisí.
Inspirace:
Hashování kalendáře pomoci emoji
Vyvážení pracovního a osobního života vyžaduje efektivní plánování času, ale pracovní kalendář často obsahuje citlivé informace, které nelze jednoduše sdílet.
Cílem práce je navrhnout, implementovat a otestovat řešení, které transformuje kalendář ve formátu iCal do podoby, kde budou názvy událostí nahrazeny vhodnými emotikony. Aplikace by zároveň měla umožňovat přizpůsobení pomocí uživatelského slovníku a využít vhodné jazykové nástroje / embeddingy.
Zdroje:
Léková data z pohledu znalostního inženýra
Cílem práce je podrobná analýza a následná vizualizace dat ze systému eRecept a údajů SÚKLu z pohledu výdeje a dostupnosti léků. Práce by měla vhodně navázat na existující práci v ODL, která se tomuto tématu věnuje a rozšířit jí o pokročilé analýzy trendů ve vydávání léků a predikce jejich dostupnosti.
Zdroje:
Vizualizace měření na mapě
Práce se zaměří na návrh a implementaci aplikace pro vizualizaci statistických datových bodů na mapě. Jako příklad použití lze zvolit měření dostupnosti internetu při opakovaných cestách vlakem po stejné trase.
Aplikace by měla využívat existující knihovny pro mapovou vizualizaci a umožnit uživatelskou kontribuci nových měření. Důraz bude kladen na přehlednost zobrazení a efektivní kontrolu kontribuovaných dat.
ISIR v2.0
Cílem práce je obnovit náš projekt pro zpracování insolvencí v ČR a přidat do něj nové funkcionality. Projekt IsirExplorer je určen veřejnosti a poskytuje přehled o stavu insolvenčních procesů. Aktuální verze projektu zpracovává starý formát dat, v současné době se ale zveřejňují jednotlivé insolvence v jiném formátu. Při aktualizaci projektu je vhodné doplnit automatické získávání dat a přidat zpracovávání délky trvání jednotlivých insolvencí.
Webová stránka projektu: https://isir-explorer.opendatalab.cz