Petr Herčko – Bakalářská práce – Ověřování politických výroků na základě parlamentních a předvolebních dat – Politické strany a veřejní představitelé často formulují sliby a prohlášení, jejichž plnění je obtížné systematicky sledovat. Práce využije embedding modely a velké jazykové modely k automatizovanému porovnání programů politických stran s parlamentními projevy a mediálními výroky.
Adam Prokop – Bakalářská práce – Zpracování a analýza záznamů z emisních kontrol vozidel v České republice – Cílem práce je přispět k veřejné diskuzi o možných nesrovnalostech či podvodech v měření emisí vozidel pomocí analýzy veřejně dostupných dat. Výsledky mohou být využitelné jak pro veřejnost, tak pro státní správu, zejména Ministerstvo dopravy.
Hana Švecová – Bakalářská práce – Analýza a predikce dopravního zatížení v Praze – Doprava v Praze je ovlivněna časovými faktory, počasím a mimořádnými událostmi a zároveň existují vazby mezi jednotlivými druhy dopravy. Cílem práce je tyto vlivy analyzovat a na základě historických dat vytvořit predikční model zatížení vybraných dopravních módů.
David Gaier – Diplomová práce – Vizualizace dopravních linek a poloh zastávek z dat NeTEx – Ministerstvo dopravy zveřejňuje jízdní řády ve formátu NeTEx, který však neobsahuje geolokační údaje potřebné pro mapovou vizualizaci spojů. Cílem práce je vytvořit aplikaci, která dopočítá polohu zastávek podle linky a směru, zobrazí linky a animuje pohyb vozidel v čase alespoň pro autobusovou dopravu. Výsledky budou ověřeny porovnáním s datovou sadou PID-GTFS.
Tiep Dang – Bakalářská práce – Odhady cen nemovitostí na základě jejich vlastností – Dostupnost bydlení je stále aktuálnějším tématem kvůli růstu cen nemovitostí, přičemž běžně dostupná data neposkytují dostatečný vhled do jejich cenotvorby. Práce se zaměří na analýzu vztahu nabídkových cen k vlastnostem nemovitostí a lokality a na návrh modelu pro jejich predikci.
Duy Khanh Bui – Bakalářská práce – Hashování kalendáře pomocí emoji – Vyvážení pracovního a osobního života vyžaduje efektivní práci s kalendářem, jehož sdílení však může narážet na požadavky informační bezpečnosti. Cílem práce je navrhnout a implementovat aplikaci, která anonymizuje kalendářové události ve formátu iCal pomocí poloautomatického převodu jejich názvů na emotikony.
Radim Květ– Diplomová práce – Dostupnost hromadné dopravy na základě dat NeTEx – Ministerstvo dopravy zveřejňuje jízdní řády ve formátu NeTEx bez geolokačních údajů potřebných pro mapovou vizualizaci. Cílem práce je vytvořit aplikaci, která dopočítá polohu zastávek, zobrazí a animuje pohyb autobusových linek v čase a výsledky ověří porovnáním s daty PID-GTFS.
Katka Bucková – Diplomová práce – Predikce zpoždění v síti PID – Cílem je na základě historických dat o provozu Pražské integrované dopravy (PID) a metod strojového učení vytvořit model pro predikci zpoždění spojů.
Jaroslav Machovec – Diplomová práce – Portál pro dostupnost léků – Cílem je vytvořit webový portál, který bude zpracovávat a vizualizovat informace o pohybech léků v distribučním řetězci a jejich předepisování a výdeji v rámci systému eRecept.
Diplomová práce STK portál nabízí informace získané na základě dat Ministerstva dopravy ČR, která lze vytěžit pomocí statistických metod a strojového učení. Dva hlavní datové zdroje, tj. seznam kontrol na STK a registr vozidel, jsou propojitelná na základě VIN kódu, který známe pro každé vozidlo v registru i každou proběhlou kontrolu. Díky tomu je možné zobrazit historii vozů v ČR a predikovat jejich chování do budoucnosti.
Bakalářská práce si kladla za cíl vytvořit webovou aplikaci, která získávala data o veřejných zakázkách v České republice a následně je vizualizovala pomocí sady interaktivních map. Výsledná aplikácia periodicky získava dáta z portálu Národní elektronický nástroj pomocou webového scrappingu. Aplikácia využíva proces geokódovania na obohatenie získaných dát o geografickú polohu jednotlivých subjektov. Získané a obohatené dáta sú vizualizované na mapách a aplikácia podporuje filtráciu zobrazených dát podľa miesta plnenia, zadávateľa a účastníka. Zobrazovanie dát o verejných zákazkách na mape slúži na identifikáciu českých, ale aj zahraničných miest, do ktorých idú verejné financie Českej republiky, čo môže byť nápomocné pre získanie väčšieho kontextu o súťažiacich stranách.
Bakalářská práce se zabývá způsoby využití LLM modelů k analýze veřejně dostupných rozhodnutí českých soudů. Hlavním cílem práce bylo lépe zpřístupnit tato rozhodnutí, a to vytvořením webové aplikace Robojudge, která umožní v databázi zveřejněných rozhodnutí vyhledávat pomocí nového typu rozhraní využívaného ve svém základu LLM k sémantickému vyhledávání, shrnování a odpovídání na otázky týkající se jednotlivých rozhodnutí.
Tato diplomová práce se zabývala automatickým čtením ze rtů v českém jazyce. Rozpoznávanie reči prebieha v nekontrolovanom prostredí, pre ktoré sú charakteristické rôzne svetelné podmienky, rôznorodé pozadie a rôzni rečníci. Všetky spomínané faktory komplikujú vizuálne spracovanie pohybov pier. Na základe existujúcich riešení pre iné jazyky, táto práca implementuje a vyhodnocuje podobné princípy v českom jazyku. Z dôvodu limitovanch zdrojov dát pre iné jazyky ako je angličtina, táto práca taktiež obsahuje proces vytvárania trénovacieho, validačného a testovacieho datasetu v českom jazyku. Vyhodnotenie následne prebieha na novovytvorenom datasete, ktorý vznikol v spolupráci s Českou Televíziou.
Cílem této bakalářské práce byla podrobná analýza a následná vizualizace existujících dat, respektive vizualizace aktuálního stavu trhu s veřejnými zakázkami v České republice. Je zde provedena explorační analýza, při které jsou vizualizovány základní popisné statistiky. Dále je v této práci využit přístup strojového učení, při kterém byla nejprve data předzpracována, včetně použití metod ”Feature Engineering“. Následně bylo na těchto datech natrénováno několik modelů pro predikci výherní nabídky a pomocí ladění hyperparametrů byl vytvořen finální model. Poté se využije tento model k prozkoumání vlivu jednotlivých příznaků a hledání anomálií, a to v kombinaci se shlukovacím algoritmem DBSCAN. Nakonec jsou všechny tyto poznatky zpracovány a vizualizovány formou webových reportů, a tím pádem jsou k dispozici široké veřejnosti.