Projekty

Aktuálně probíhající práce

Bakalářská práce – Detekce anonymizovaných oblastí ve smlouvách v registru smluv – Cílem je v zadaném pdf spočítat začerněnou plochu – může být buď začerněna, zaplněna zrněním, případně zabílena s komentářem. – Lukáš Salak

Realizované projekty

STK portál 2.0

Diplomová práce STK portál nabízí informace získané na základě dat Ministerstva dopravy ČR, která lze vytěžit pomocí statistických metod a strojového učení. Dva hlavní datové zdroje, tj. seznam kontrol na STK a registr vozidel, jsou propojitelná na základě VIN kódu, který známe pro každé vozidlo v registru i každou proběhlou kontrolu. Díky tomu je možné zobrazit historii vozů v ČR a predikovat jejich chování do budoucnosti.

Repozitář: https://github.com/opendatalabcz/STK-portal

COVID-19 očkování

Tento web poskytuje statistická data o jednotlivých očkovacích místech i celkové statistiky pro Českou republiku. Systém registrace je komplikovaný a pro správný výběr očkovacího místa je nezbytné si přečíst jak celá registrace funguje. Data pochází z opendat Ministerstva zdravotnictví ČR a od Centrálního řídícího týmu COVID-19 (CŘT).

Repozitář: https://github.com/msusicky/ockovani-covid

ISIR Explorer

Diplomová práce Pavla Tůmy se věnuje hlavně oddlužení fyzických osob. Umožňuje sběr a následné zobrazení agregovaných dat o insolvencích v ČR. Tento web slouží k prezentaci získaných dat a nabízí detailní statistiky těchto řízení za posledních několik let. Projekt je určen veřejnosti pro poskytnutí přehledu o stavu insolvenčního procesu v ČR. Data jsou získávána automatizovaným čtením PDF dokumentů zveřejňovaných v insolvenčním rejstříku. Doplňujícím zdrojem dat je databáze insolvenčního rejstříku poskytovaná formou webové služby Ministerstvem spravedlnosti ČR.

Repozitář: https://github.com/opendatalabcz/isir-explorer

Zpracování transparentních účtů

Cílem bakalářské práce byl vývoj webové aplikace, která zpracovává data transparentních účtů z webových stránek bank. Aplikace následně získaná data analyzuje a zpřístupňuje veřejnosti pomocí API. Součástí analýzy jsou statistické údaje, agregace transakcí podle protistrany s vyhledáním protistrany v transakcích jiných transparentních účtů a vizualizace transakcí v čase.

Repozitář: https://github.com/opendatalabcz/transparent-accounts

STK portál

Portál obsahuje výsledky analýzy dat a další informace o stanicích technické kontroly a byl vypracován v rámci bakalářské práce na Fakultě informačních technologií ČVUT v roce 2020. Účelem tohoto portálu je nejen popisovat stanice a statistiky kontrol, ale i upozorňovat na podezřelé chování na stanicích. Navíc v sekci VIN info můžete pomocí zadání VIN čísla vyhledat informace o daném vozidle.

Repozitář: https://github.com/opendatalabcz/stk-data-analysis

Zadání na rozšíření: https://opendatalab.cz/zadani/stk-portal/

Tender Maps

Bakalářská práce si kladla za cíl vytvořit webovou aplikaci, která získávala data o veřejných zakázkách v České republice a následně je vizualizovala pomocí sady interaktivních map. Výsledná aplikácia periodicky získava dáta z portálu Národní elektronický nástroj pomocou webového scrappingu. Aplikácia využíva proces geokódovania na obohatenie získaných dát o geografickú polohu jednotlivých subjektov. Získané a obohatené dáta sú vizualizované na mapách a aplikácia podporuje filtráciu zobrazených dát podľa miesta plnenia, zadávateľa a účastníka. Zobrazovanie dát o verejných zákazkách na mape slúži na identifikáciu českých, ale aj zahraničných miest, do ktorých idú verejné financie Českej republiky, čo môže byť nápomocné pre získanie väčšieho kontextu o súťažiacich stranách.

Repozitář: https://github.com/opendatalabcz/tender-maps

Robojudge

Autor: Miroslav Řehounek

Bakalářská práce se zabývá způsoby využití LLM modelů k analýze veřejně dostupných rozhodnutí českých soudů. Hlavním cílem práce bylo lépe zpřístupnit tato rozhodnutí, a to vytvořením webové aplikace Robojudge, která umožní v databázi zveřejněných rozhodnutí vyhledávat pomocí nového typu rozhraní využívaného ve svém základu LLM k sémantickému vyhledávání, shrnování a odpovídání na otázky týkající se jednotlivých rozhodnutí.

Repozitář: https://github.com/opendatalabcz/Robojudge

Lékaři v ČR

Předmětem této diplomové práce byla analýza a predikce dostupnosti lékařské péče v České republice. Ta se skládá z několika částí, kterými jsou predikce lékařských výkonů, přírůstku nových lékařů a aktivních lékařů.

Práce sleduje meziroční vývoje vybraných onemocnění a lékařských zákroků. Zaměřuje se na zanedbávání zdravotní péče pojištěnci, primárně v oblasti stomatologických zákroků. Dále sleduje aktuální stav lékařů v jednotlivých specializacích a okresech se speciálním zaměřením na věk. V práci jsou diskutovány dopady legislativních kroků okolních států, vysokých škol a státních orgánů na vývoji nových lékařů. Zároveň jsou reflektovány aktuální trendy ve volbě lékařské specializace, na základě kterých jsou noví lékaři rozdělováni.

Twitter: @Lekari_v_CR

Repozitář: https://github.com/opendatalabcz/mapa-zdravi

Edigio – platforma pro řešení katastrof

Autor: Filip Ballek

Tato bakalářská práce měla za cíl pomoci lidem, kteří chtějí nabídnout nebo požadovat pomoc během jedné z mnoha katastrof, které se každý rok na planetě Zemi odehrávají. V rámci práce byla vytvořena platforma, která měla potenciál zefektivnit poskytování a poptávání pomoci ve srovnání s existujícími řešeními. Byl proveden průzkum podobných dostupných řešení na internetu. Následně byla navržena, implementována a otestována platforma. Součástí testování bylo vytvoření 23 testovacích scénářů.

Repozitář: https://github.com/opendatalabcz/Egidio