Projekty

Aktuálně probíhající práce

Diplomová práce – STK portál – Cílem je vytvořit portál sloužící k ověření vozidla pomocí STK prohlídek s daty od 1/2018. – Daniel Brotz

Diplomová práce – Odezírání – Cílem této práce je vytvoření experimentálního datového souboru pro slovenský nebo český jazyk, na kterém budou zkoumány výkony minimálně 2 modelů vhodných pro rozpoznávání vizuální řeči. – Justína Kušpálová

Bakalářská práce – Analyzátor výherců veřejných zakázek – Cílem je vytvořit webovou aplikaci – analyzátor veřejných zakázek, který umožní vyhledávat jednotlivé zadavatele veřejných zakázek a jejich výherce pomocí mapy. – Marek Drozdík

Bakalářská práce – Robojudge – analýza soudních rozhodnutí – Cílem práce je vytvořit webovou aplikaci, která využije LLM (Large Language Model) modely k analýze získaných soudních rozsudků a zobrazí výsledky prostřednictvím webového rozhraní. – Miroslav Řehounek

Bakalářská práce – Detekce anonymizovaných oblastí ve smlouvách v registru smluv – Cílem je v zadaném pdf spočítat začerněnou plochu – může být buď začerněna, zaplněna zrněním, případně zabílena s komentářem. – Lukáš Salak

Bakalářská práce – Analýza výherců veřejných zakázek – Cílem práce je podrobně zanalyzovat data z veřejných zakázek, najít v nich případné anomálie či identifikovat zajímavé skupiny a všechny tyto poznatky vizualizovat formou webové aplikace. – Martin Pribyl

Realizované projekty

COVID-19 očkování

Autoři: Marek Sušický a Honza Staněk

https://ockovani.opendatalab.cz/

Tento web poskytuje statistická data o jednotlivých očkovacích místech i celkové statistiky pro Českou republiku. Systém registrace je komplikovaný a pro správný výběr očkovacího místa je nezbytné si přečíst jak celá registrace funguje. Data pochází z opendat Ministerstva zdravotnictví ČR a od Centrálního řídícího týmu COVID-19 (CŘT).

Repozitář: https://github.com/msusicky/ockovani-covid

ISIR Explorer

Autor: Pavel Tůma

https://isir-explorer.opendatalab.cz/

Diplomová práce Pavla Tůmy se věnuje hlavně oddlužení fyzických osob. Umožňuje sběr a následné zobrazení agregovaných dat o insolvencích v ČR. Tento web slouží k prezentaci získaných dat a nabízí detailní statistiky těchto řízení za posledních několik let. Projekt je určen veřejnosti pro poskytnutí přehledu o stavu insolvenčního procesu v ČR. Data jsou získávána automatizovaným čtením PDF dokumentů zveřejňovaných v insolvenčním rejstříku. Doplňujícím zdrojem dat je databáze insolvenčního rejstříku poskytovaná formou webové služby Ministerstvem spravedlnosti ČR.

Repozitář: https://github.com/opendatalabcz/isir-explorer

Zpracování transparentních účtů

Autor: Jakub Janeček

https://transparentniucty.opendatalab.cz

Cílem bakalářské práce byl vývoj webové aplikace, která zpracovává data transparentních účtů z webových stránek bank. Aplikace následně získaná data analyzuje a zpřístupňuje veřejnosti pomocí API. Součástí analýzy jsou statistické údaje, agregace transakcí podle protistrany s vyhledáním protistrany v transakcích jiných transparentních účtů a vizualizace transakcí v čase.

Repozitář: https://github.com/opendatalabcz/transparent-accounts

STK portál

Autorka: Aleksandra Parkhomenko

https://stk-test.opendatalab.cz/

Portál obsahuje výsledky analýzy dat a další informace o stanicích technické kontroly a byl vypracován v rámci bakalářské práce na Fakultě informačních technologií ČVUT v roce 2020. Účelem tohoto portálu je nejen popisovat stanice a statistiky kontrol, ale i upozorňovat na podezřelé chování na stanicích. Navíc v sekci VIN info můžete pomocí zadání VIN čísla vyhledat informace o daném vozidle.

Repozitář: https://github.com/opendatalabcz/stk-data-analysis

Zadání na rozšíření: https://opendatalab.cz/zadani/stk-portal/

Lékaři v ČR

Autor: Jan Garček

https://lekarivcr.opendatalab.cz

Předmětem této diplomové práce byla analýza a predikce dostupnosti lékařské péče v České republice. Ta se skládá z několika částí, kterými jsou predikce lékařských výkonů, přírůstku nových lékařů a aktivních lékařů.

Práce sleduje meziroční vývoje vybraných onemocnění a lékařských zákroků. Zaměřuje se na zanedbávání zdravotní péče pojištěnci, primárně v oblasti stomatologických zákroků. Dále sleduje aktuální stav lékařů v jednotlivých specializacích a okresech se speciálním zaměřením na věk. V práci jsou diskutovány dopady legislativních kroků okolních států, vysokých škol a státních orgánů na vývoji nových lékařů. Zároveň jsou reflektovány aktuální trendy ve volbě lékařské specializace, na základě kterých jsou noví lékaři rozdělováni.

Twitter: @Lekari_v_CR

Repozitář: https://github.com/opendatalabcz/mapa-zdravi

Edigio – platforma pro řešení katastrof

Autor: Filip Ballek

Tato bakalářská práce měla za cíl pomoci lidem, kteří chtějí nabídnout nebo požadovat pomoc během jedné z mnoha katastrof, které se každý rok na planetě Zemi odehrávají. V rámci práce byla vytvořena platforma, která měla potenciál zefektivnit poskytování a poptávání pomoci ve srovnání s existujícími řešeními. Byl proveden průzkum podobných dostupných řešení na internetu. Následně byla navržena, implementována a otestována platforma. Součástí testování bylo vytvoření 23 testovacích scénářů.

Repozitář: https://github.com/opendatalabcz/Egidio

Tenis | Algoritmy pro detekci trajektorie míče

Autor: Jakub Pečenka

Cílem diplomové práce bylo nastudovat problém detekování trajektorie tenisového míče v obrazovém záznamu a určit vhodné výstupy. Dále navrhnout vhodný přístup k
detekci trajektorie tenisového míčku a následném získávání vhodných výstupů
z této trajektorie. Navržené řešení implementovat s ohledem na výpočetní čas a zvážit jeho paralelizaci. Na závěr vyhodnotit správnost poskytovaných výstupů a výpočetní čas systému a provést vizualizaci řešení.

Repozitář: https://github.com/opendatalabcz/tenis

Systém pro automatizaci dopravních průzkumů

Autor: Ondrej Pudiš

Tato diplomová práce se věnovala vývoji otevřeného softwaru, který umožní automatizaci dopravních průzkumů. Na začátku se diskutovali a objevovali různé přístupy ke sledování více objektů ve videu současně. Následně byl navržen modul, který analyzuje nahrávku ze stacionární kamery a spočítá dopravní prostředky procházející přes oblasti zájmu definované uživatelem. Kvalita modulu byla ohodnocena na několika videích. Bylo zjištěno, že modul funguje dobře a v rámci přípustné chyby, pokud ve výhledu nepřekáží dopravní značení nebo jiné automobily.

Repozitář: https://github.com/opendatalabcz/traffic-surveys-automation

Zpracování výpisu z účtu pomocí metod strojového učení

Autor: Michal Lebeda

Tato bakalářská práce se zabývala strojovým zpracováním výpisu z účtu ve formátu PDF. Jelikož se jednalo o nestrukturovaný dokument, nebylo možné získat informace o účtu a jednotlivých transakcích přímočaře pro další využití. Cílem práce bylo převést zmíněný dokument do strukturovaného formátu. Proto byla nejprve provedena rešerše formátu PDF a existujících metod strojového čtení nestrukturovaných dokumentů, spolu s analýzou veřejně dostupných datasetů. Tyto datasety byly porovnány a diskutovalo se o jejich využitelnosti při řešení dané úlohy. V praktické části byl popsán částečně automatizovaný postup tvorby vlastního datasetu z veřejně dostupných výpisů z účtu. Byla vysvětlena problematika této činnosti a následně byl vytvořen model strojového učení. Výsledkem práce je aplikace pro zpracování výpisu z účtu do strukturovaného formátu.

CzechCaptcha | modul importu dat

Autor: Jakub Bůlfinek

V rámci této bakalářské práce byl do aplikace CzechCaptcha přidán modul pro import dat obsahující model pro detekci objektů v obrázku EfficientDet-V4 z frameworku KotlinDL natrénovaný na datasetu COCO. Při nahrávání obrázku do aplikace lze určit, které objekty v něm mají být detekovány. V případě, že model jejich detekci podporuje, jsou na základě jeho výstupů do lokálního úložiště uloženy výřezy obrázku určené pro použití ve výběrové obrázkové CAPTCHA úloze. V opačném případě je původní obrázek použit v nové CAPTCHA úloze pro detekci objektů, v níž testovaný uživatel pomocí obdélníků označuje požadované objekty.

Repozitář: https://github.com/opendatalabcz/czech-captcha

Parking spot detection | Vyhledávač parkovacích míst

Autor: Jiří Groh

Hlavním cílem diplomové práce bylo navrhnout a implementovat autonomní systém, který extrahuje parkovací místa na parkovišti z kamerového streamu. Tento systém také vyhodnocuje a zaznamenává obsazenost parkoviště v průběhu času. Systém využívá tzv. „processing pipeline“, která periodicky snímá obraz ze streamu a lokalizuje vozidla pomocí detektoru objektů. Systém vykonává vzorkování na základě času s cílem odfiltrovat pohybující se vozidla a případně potvrdit parkovací místa. Potvrzená parkovací místa jsou pravidelně vyhodnocována z hlediska obsazenosti vlastním klasifikátorem.

Repozitář: https://github.com/opendatalabcz/parking-spot-detection

GeoTrashing

Autoři: Tomáš Karella, Vladislav Vancák a Nikita Tishin

https://geotrashing.opendatalab.cz/

Myšlenka GeoTrashingu vznikla na podzim roku 2019 na hackathonu NKU. Projekt nabízí způsob, jak dát rychle a snadno vědět, které kontejnery jsou plné.  V dnešní době existuje řešení na sledování zaplněnosti tříděných odpadových nádob, ale senzory jsou drahé a není možné je umístit všude. Nálepka s QR kódem nestojí moc a je možné ji nalepit takřka kamkoliv. Cílem je tedy nikoliv nahrazovat, ale doplňovat senzory tam, kde to nedává ekonomický smysl.

Repozitář: https://github.com/opendatalabcz/geotrashing/tree/develop

Aplikace pro rozpoznávání ukradených obrazů

Autor: Michal Janeček

Bakalářská práce Michala Janečka se zabývá vývojem mobilní aplikace k rozpoznávání kradených obrazů. Nejdříve uvede do problému krádeže uměleckých děl a popisuje současné možnosti jejich rozpoznávání. Dále obsahuje návrh aplikace s třívrstvou architekturou a popis technologií, které byly pro její vývoj použity. Pro rozpoznávání obrazů, které se provádí na serveru, používá algoritmus ORB, který je v práci detailně popsán. Testování bylo prováděno na více datasetech s 1800 obrazy a jednom datasetu obsahujícím přes 9000 obrazů. Při testování s lehce augmentovanými obrazy byla dosažena přesnost okolo 90%, pro více augmentované obrazy zhruba 50%. Výsledný software zahrnuje mobilního klienta, server a databázi a může být použit pro rozpoznávání kradených obrazů.

Repozitář: https://github.com/opendatalabcz/stolen-art

Eco web

Autor: Roman Soběslav

https://eco-web-test.opendatalab.cz/

Cílem této bakalářské práce bylo analyzovat veřejně dostupná ekologická data a zvolit vhodná pro vizualizaci dat. Dále se práce zabývá analýzou již existujícich řešení. Práce se následně zabývá návrhem a implementací jednotlivých částí pro získání dat, databázi, backend a frontend. Část pro získání dat se zabývá získáváním dat ze stránek ČHMÚ.

Repozitář: https://github.com/opendatalabcz/eco-web

Analýza úředních desek

Autor: Jakub Kučera

Cílem bakalářské práce bylo analyzovat webové úředný desky, které byly publikovány jako otevřená data, a následně výsledky zobrazit na webové stránce. Všechna tato zpracovaná data jsou uložené do databáze. Jednotlivé statistiky si může uživatel prohlédnout na několika grafech, které jsou součástí webové stránky.

Repozitář: https://github.com/opendatalabcz/official-notice-boards