Projekty

Aktuálně probíhající práce

Bakalářská práce – Detekce anonymizovaných oblastí ve smlouvách v registru smluv – Cílem je v zadaném pdf spočítat začerněnou plochu – může být buď začerněna, zaplněna zrněním, případně zabílena s komentářem. – Lukáš Salak

Realizované projekty

STK portál 2.0

Autor: Daniel Brotz

https://stk.opendatalab.cz

Diplomová práce STK portál nabízí informace získané na základě dat Ministerstva dopravy ČR, která lze vytěžit pomocí statistických metod a strojového učení. Dva hlavní datové zdroje, tj. seznam kontrol na STK a registr vozidel, jsou propojitelná na základě VIN kódu, který známe pro každé vozidlo v registru i každou proběhlou kontrolu. Díky tomu je možné zobrazit historii vozů v ČR a predikovat jejich chování do budoucnosti.

Repozitář: https://github.com/opendatalabcz/STK-portal

COVID-19 očkování

Autoři: Marek Sušický a Honza Staněk

https://ockovani.opendatalab.cz/

Tento web poskytuje statistická data o jednotlivých očkovacích místech i celkové statistiky pro Českou republiku. Systém registrace je komplikovaný a pro správný výběr očkovacího místa je nezbytné si přečíst jak celá registrace funguje. Data pochází z opendat Ministerstva zdravotnictví ČR a od Centrálního řídícího týmu COVID-19 (CŘT).

Repozitář: https://github.com/msusicky/ockovani-covid

ISIR Explorer

Autor: Pavel Tůma

https://isir-explorer.opendatalab.cz/

Diplomová práce Pavla Tůmy se věnuje hlavně oddlužení fyzických osob. Umožňuje sběr a následné zobrazení agregovaných dat o insolvencích v ČR. Tento web slouží k prezentaci získaných dat a nabízí detailní statistiky těchto řízení za posledních několik let. Projekt je určen veřejnosti pro poskytnutí přehledu o stavu insolvenčního procesu v ČR. Data jsou získávána automatizovaným čtením PDF dokumentů zveřejňovaných v insolvenčním rejstříku. Doplňujícím zdrojem dat je databáze insolvenčního rejstříku poskytovaná formou webové služby Ministerstvem spravedlnosti ČR.

Repozitář: https://github.com/opendatalabcz/isir-explorer

Zpracování transparentních účtů

Autor: Jakub Janeček

https://transparentniucty.opendatalab.cz

Cílem bakalářské práce byl vývoj webové aplikace, která zpracovává data transparentních účtů z webových stránek bank. Aplikace následně získaná data analyzuje a zpřístupňuje veřejnosti pomocí API. Součástí analýzy jsou statistické údaje, agregace transakcí podle protistrany s vyhledáním protistrany v transakcích jiných transparentních účtů a vizualizace transakcí v čase.

Repozitář: https://github.com/opendatalabcz/transparent-accounts

STK portál

Autorka: Aleksandra Parkhomenko

https://stk-test.opendatalab.cz/

Portál obsahuje výsledky analýzy dat a další informace o stanicích technické kontroly a byl vypracován v rámci bakalářské práce na Fakultě informačních technologií ČVUT v roce 2020. Účelem tohoto portálu je nejen popisovat stanice a statistiky kontrol, ale i upozorňovat na podezřelé chování na stanicích. Navíc v sekci VIN info můžete pomocí zadání VIN čísla vyhledat informace o daném vozidle.

Repozitář: https://github.com/opendatalabcz/stk-data-analysis

Zadání na rozšíření: https://opendatalab.cz/zadani/stk-portal/

Tender Maps

Autor: Marek Drozdík

https://tendermaps.opendatalab.cz

Bakalářská práce si kladla za cíl vytvořit webovou aplikaci, která získávala data o veřejných zakázkách v České republice a následně je vizualizovala pomocí sady interaktivních map. Výsledná aplikácia periodicky získava dáta z portálu Národní elektronický nástroj pomocou webového scrappingu. Aplikácia využíva proces geokódovania na obohatenie získaných dát o geografickú polohu jednotlivých subjektov. Získané a obohatené dáta sú vizualizované na mapách a aplikácia podporuje filtráciu zobrazených dát podľa miesta plnenia, zadávateľa a účastníka. Zobrazovanie dát o verejných zákazkách na mape slúži na identifikáciu českých, ale aj zahraničných miest, do ktorých idú verejné financie Českej republiky, čo môže byť nápomocné pre získanie väčšieho kontextu o súťažiacich stranách.

Repozitář: https://github.com/opendatalabcz/tender-maps

Robojudge

Autor: Miroslav Řehounek

https://robojudge.opendatalab.cz

Bakalářská práce se zabývá způsoby využití LLM modelů k analýze veřejně dostupných rozhodnutí českých soudů. Hlavním cílem práce bylo lépe zpřístupnit tato rozhodnutí, a to vytvořením webové aplikace Robojudge, která umožní v databázi zveřejněných rozhodnutí vyhledávat pomocí nového typu rozhraní využívaného ve svém základu LLM k sémantickému vyhledávání, shrnování a odpovídání na otázky týkající se jednotlivých rozhodnutí.

Repozitář: https://github.com/opendatalabcz/Robojudge

Lékaři v ČR

Autor: Jan Garček

https://lekarivcr.opendatalab.cz

Předmětem této diplomové práce byla analýza a predikce dostupnosti lékařské péče v České republice. Ta se skládá z několika částí, kterými jsou predikce lékařských výkonů, přírůstku nových lékařů a aktivních lékařů.

Práce sleduje meziroční vývoje vybraných onemocnění a lékařských zákroků. Zaměřuje se na zanedbávání zdravotní péče pojištěnci, primárně v oblasti stomatologických zákroků. Dále sleduje aktuální stav lékařů v jednotlivých specializacích a okresech se speciálním zaměřením na věk. V práci jsou diskutovány dopady legislativních kroků okolních států, vysokých škol a státních orgánů na vývoji nových lékařů. Zároveň jsou reflektovány aktuální trendy ve volbě lékařské specializace, na základě kterých jsou noví lékaři rozdělováni.

Twitter: @Lekari_v_CR

Repozitář: https://github.com/opendatalabcz/mapa-zdravi

Edigio – platforma pro řešení katastrof

Autor: Filip Ballek

Tato bakalářská práce měla za cíl pomoci lidem, kteří chtějí nabídnout nebo požadovat pomoc během jedné z mnoha katastrof, které se každý rok na planetě Zemi odehrávají. V rámci práce byla vytvořena platforma, která měla potenciál zefektivnit poskytování a poptávání pomoci ve srovnání s existujícími řešeními. Byl proveden průzkum podobných dostupných řešení na internetu. Následně byla navržena, implementována a otestována platforma. Součástí testování bylo vytvoření 23 testovacích scénářů.

Repozitář: https://github.com/opendatalabcz/Egidio

Tenis | Algoritmy pro detekci trajektorie míče

Autor: Jakub Pečenka

Cílem diplomové práce bylo nastudovat problém detekování trajektorie tenisového míče v obrazovém záznamu a určit vhodné výstupy. Dále navrhnout vhodný přístup k
detekci trajektorie tenisového míčku a následném získávání vhodných výstupů
z této trajektorie. Navržené řešení implementovat s ohledem na výpočetní čas a zvážit jeho paralelizaci. Na závěr vyhodnotit správnost poskytovaných výstupů a výpočetní čas systému a provést vizualizaci řešení.

Repozitář: https://github.com/opendatalabcz/tenis

Systém pro automatizaci dopravních průzkumů

Autor: Ondrej Pudiš

Tato diplomová práce se věnovala vývoji otevřeného softwaru, který umožní automatizaci dopravních průzkumů. Na začátku se diskutovali a objevovali různé přístupy ke sledování více objektů ve videu současně. Následně byl navržen modul, který analyzuje nahrávku ze stacionární kamery a spočítá dopravní prostředky procházející přes oblasti zájmu definované uživatelem. Kvalita modulu byla ohodnocena na několika videích. Bylo zjištěno, že modul funguje dobře a v rámci přípustné chyby, pokud ve výhledu nepřekáží dopravní značení nebo jiné automobily.

Repozitář: https://github.com/opendatalabcz/traffic-surveys-automation

Zpracování výpisu z účtu pomocí metod strojového učení

Autor: Michal Lebeda

Tato bakalářská práce se zabývala strojovým zpracováním výpisu z účtu ve formátu PDF. Jelikož se jednalo o nestrukturovaný dokument, nebylo možné získat informace o účtu a jednotlivých transakcích přímočaře pro další využití. Cílem práce bylo převést zmíněný dokument do strukturovaného formátu. Proto byla nejprve provedena rešerše formátu PDF a existujících metod strojového čtení nestrukturovaných dokumentů, spolu s analýzou veřejně dostupných datasetů. Tyto datasety byly porovnány a diskutovalo se o jejich využitelnosti při řešení dané úlohy. V praktické části byl popsán částečně automatizovaný postup tvorby vlastního datasetu z veřejně dostupných výpisů z účtu. Byla vysvětlena problematika této činnosti a následně byl vytvořen model strojového učení. Výsledkem práce je aplikace pro zpracování výpisu z účtu do strukturovaného formátu.

Odezírání

Autor: Justína Kušpálová

Tato diplomová práce se zabývala automatickým čtením ze rtů v českém jazyce. Rozpoznávanie reči prebieha v nekontrolovanom prostredí, pre ktoré sú charakteristické rôzne svetelné podmienky, rôznorodé pozadie a rôzni rečníci. Všetky spomínané faktory komplikujú vizuálne spracovanie pohybov pier. Na základe existujúcich riešení pre iné jazyky, táto práca implementuje a vyhodnocuje podobné princípy v českom jazyku. Z dôvodu limitovanch zdrojov dát pre iné jazyky ako je angličtina, táto práca taktiež obsahuje proces vytvárania trénovacieho, validačného a testovacieho datasetu v českom jazyku. Vyhodnotenie následne prebieha na novovytvorenom datasete, ktorý vznikol v spolupráci s Českou Televíziou.

CzechCaptcha | modul importu dat

Autor: Jakub Bůlfinek

V rámci této bakalářské práce byl do aplikace CzechCaptcha přidán modul pro import dat obsahující model pro detekci objektů v obrázku EfficientDet-V4 z frameworku KotlinDL natrénovaný na datasetu COCO. Při nahrávání obrázku do aplikace lze určit, které objekty v něm mají být detekovány. V případě, že model jejich detekci podporuje, jsou na základě jeho výstupů do lokálního úložiště uloženy výřezy obrázku určené pro použití ve výběrové obrázkové CAPTCHA úloze. V opačném případě je původní obrázek použit v nové CAPTCHA úloze pro detekci objektů, v níž testovaný uživatel pomocí obdélníků označuje požadované objekty.

Repozitář: https://github.com/opendatalabcz/czech-captcha

Parking spot detection | Vyhledávač parkovacích míst

Autor: Jiří Groh

Hlavním cílem diplomové práce bylo navrhnout a implementovat autonomní systém, který extrahuje parkovací místa na parkovišti z kamerového streamu. Tento systém také vyhodnocuje a zaznamenává obsazenost parkoviště v průběhu času. Systém využívá tzv. „processing pipeline“, která periodicky snímá obraz ze streamu a lokalizuje vozidla pomocí detektoru objektů. Systém vykonává vzorkování na základě času s cílem odfiltrovat pohybující se vozidla a případně potvrdit parkovací místa. Potvrzená parkovací místa jsou pravidelně vyhodnocována z hlediska obsazenosti vlastním klasifikátorem.

Repozitář: https://github.com/opendatalabcz/parking-spot-detection

GeoTrashing

Autoři: Tomáš Karella, Vladislav Vancák a Nikita Tishin

https://geotrashing.opendatalab.cz/

Myšlenka GeoTrashingu vznikla na podzim roku 2019 na hackathonu NKU. Projekt nabízí způsob, jak dát rychle a snadno vědět, které kontejnery jsou plné.  V dnešní době existuje řešení na sledování zaplněnosti tříděných odpadových nádob, ale senzory jsou drahé a není možné je umístit všude. Nálepka s QR kódem nestojí moc a je možné ji nalepit takřka kamkoliv. Cílem je tedy nikoliv nahrazovat, ale doplňovat senzory tam, kde to nedává ekonomický smysl.

Repozitář: https://github.com/opendatalabcz/geotrashing/tree/develop

Aplikace pro rozpoznávání ukradených obrazů

Autor: Michal Janeček

Bakalářská práce Michala Janečka se zabývá vývojem mobilní aplikace k rozpoznávání kradených obrazů. Nejdříve uvede do problému krádeže uměleckých děl a popisuje současné možnosti jejich rozpoznávání. Dále obsahuje návrh aplikace s třívrstvou architekturou a popis technologií, které byly pro její vývoj použity. Pro rozpoznávání obrazů, které se provádí na serveru, používá algoritmus ORB, který je v práci detailně popsán. Testování bylo prováděno na více datasetech s 1800 obrazy a jednom datasetu obsahujícím přes 9000 obrazů. Při testování s lehce augmentovanými obrazy byla dosažena přesnost okolo 90%, pro více augmentované obrazy zhruba 50%. Výsledný software zahrnuje mobilního klienta, server a databázi a může být použit pro rozpoznávání kradených obrazů.

Repozitář: https://github.com/opendatalabcz/stolen-art

Eco web

Autor: Roman Soběslav

https://eco-web-test.opendatalab.cz/

Cílem této bakalářské práce bylo analyzovat veřejně dostupná ekologická data a zvolit vhodná pro vizualizaci dat. Dále se práce zabývá analýzou již existujícich řešení. Práce se následně zabývá návrhem a implementací jednotlivých částí pro získání dat, databázi, backend a frontend. Část pro získání dat se zabývá získáváním dat ze stránek ČHMÚ.

Repozitář: https://github.com/opendatalabcz/eco-web

Analýza výherců veřejných zakázek

Autor: Martin Pribyl

https://tenderdashboard.opendatalab.cz/

Cílem této bakalářské práce byla podrobná analýza a následná vizualizace existujících dat, respektive vizualizace aktuálního stavu trhu s veřejnými zakázkami v České republice. Je zde provedena explorační analýza, při které jsou vizualizovány základní popisné statistiky. Dále je v této práci využit přístup strojového učení, při kterém byla nejprve data předzpracována, včetně použití metod ”Feature Engineering“. Následně bylo na těchto datech natrénováno několik modelů pro predikci výherní nabídky a pomocí ladění hyperparametrů byl vytvořen finální model. Poté se využije tento model k prozkoumání vlivu jednotlivých příznaků a hledání anomálií, a to v kombinaci se shlukovacím algoritmem DBSCAN. Nakonec jsou všechny tyto poznatky zpracovány a vizualizovány formou webových reportů, a tím pádem jsou k dispozici široké veřejnosti.

Repozitář: https://github.com/opendatalabcz/analysis-public-procurement