Projekty

Zpracování výpisu z účtu pomocí metod strojového učení

18. 7. 2023Autor: Michal Lebeda

Tato bakalářská práce se zabývala strojovým zpracováním výpisu z účtu ve formátu PDF. Jelikož se jednalo o nestrukturovaný dokument, nebylo možné získat informace o účtu a jednotlivých transakcích přímočaře pro další využití. Cílem práce bylo převést zmíněný dokument do strukturovaného formátu. Proto byla nejprve provedena rešerše formátu PDF a existujících metod strojového čtení nestrukturovaných dokumentů, spolu s analýzou veřejně dostupných datasetů. Tyto datasety byly porovnány a diskutovalo se o jejich využitelnosti při řešení dané úlohy. V praktické části byl popsán částečně automatizovaný postup tvorby vlastního datasetu z veřejně dostupných výpisů z účtu. Byla vysvětlena problematika této činnosti a následně byl vytvořen model strojového učení. Výsledkem práce je aplikace pro zpracování výpisu z účtu do strukturovaného formátu.