DZB - Zverejnená bakalárska práca

Identifikácia hraníc viet a dopĺňanie interpunkčných znamienok

Autor
Lindvai, Dárius
Školiteľ
Hládek, Daniel
Oponent
Staš, Ján
Škola
Technická univerzita v Košiciach 1040 104005
Rok odovzdania
2019
Počet strán
36s.
Trvalý odkaz - CRZP
https://opac.crzp.sk/?fn=detailBiblioForm&sid=2D0B46080A5AC858AA11B21AE978
Primárny jazyk
slovenčina

Typ práce
Bakalárska práca

Študijný odbor
2523 | počítačové inžinierstvo

Dátum zaslania práce do CRZP
24.05.2019

Dátum vytvorenia protokolu
24.05.2019

Dátum doručenia informácií o licenčnej zmluve
03.07.2019

Práca je zverejniteľná od
24.05.2019

Elektronická verzia
 Prehliadať
Bakalárska práca sa zameriava na overenie presnosti systému Punctuator 2, ktorý vykonáva dopĺňanie interpunkcie a identifikáciu hraníc viet, v slovenských textoch. Súčasťou overenia je vykonanie experimentov s rôznymi parametrami. Na základe vyhodnotenia a porovnania výsledkov je možné odhadnúť vhodné parametre pre ďalšiu prácu s textom v slovenskom jazyku. Práca tiež obsahuje teoretický rozbor danej problematiky, ktorý zahŕňa základné informácie o neurónových sieťach, detailnejší opis LSTM a GRU sietí a opis parametrov precision, recall a F-score, pomocou ktorých je možné vyhodnotiť a porovnať výsledky experimentov. Spracovanie súčasného stavu v oblasti dopĺňania diakritiky pomocou odbornej literatúry a predstavenie modelu Punctuator 2 je taktiež jednou z častí tejto bakalárskej práce.
The aim of the bachelor thesis is to verify the accuracy of the system called Punctuator 2, which performs automatic punctuation restoration and sentence boundary detection, in the Slovak language. Verification included performing experiments using various parameters. Based on the evaluation and comparison of the results, it is possible to estimate suitable parameters for further work with the text in the Slovak language. The thesis also includes a theoretical analysis of the issue, which contains of basic information about neural networks, a more detailed description of the LSTM and GRU networks and characterization of the parameters precision, recall and F-score, by which it is possible to evaluate and compare the results of the experiments. Summary the current state of punctuation restoration issue using literature and the introduction of the Punctuator 2 model is also one of the parts of the bachelor thesis.

Verzia systému: 6.2.61.5 z 31.03.2023 (od SVOP)