2023-06-29 08:42:00 +00:00
---
title: Nikita Bodnár
published: true
taxonomy:
category: [vp2023,bp2024]
tag: [chatbot,rasa,dialog,nlp]
author: Daniel Hladek
---
rok začiatku štúdia: 2021
# Bakalárska práca 2024
Korekcia textu pomocou neurónových sietí-
Spolupráca: Maroš Harahus
Návrh na zadanie BP:
- Oboznámte sa s existujúcimi systémami pre neurónový strojový preklad.
- Naučte sa používať vybraný systém pre strojový preklad.
- Aplikujte existujúci model na opravu textu vo vybraných úlohách.
- Vyhodnnotte model pomocou overovacej množiny.
2023-11-23 13:01:12 +00:00
Stretnutie 23.11.2023
Stav:
- Prečítaný článok o Spelling a urobené poznámky
- Ostatné úlohy: in progress. Treba pridať!!!
Úlohy:
- Vedúcim bol odovzdaný funkčný Marian na servri IDOC. Aj model pre generovanie-opravu znakov. Oboznámte sa so systémov. Spustite model pre preklad. Spustite trénovanie.
- Vyhodndotte presnosť tohoto systému. Presnosť sa hodnotí metrikou WER, CER. Skripty nájdete v bert-train repozitári.
- Zlepšite tento systém.
- V texte vysvetlite, ako funguje model typu Transformer. Vysvetlite, ako funguje Marian NMT. Aké neurónové siete používa? Uvedte aj odkazy na odborné články.
2023-06-29 08:42:00 +00:00
2023-10-06 07:32:25 +00:00
Stretnutie 6.10.
2023-06-29 08:42:00 +00:00
Stav:
2023-10-06 07:32:25 +00:00
- Štúdium Python a neurónové siete.
2023-07-03 14:21:08 +00:00
Stretnutie 3.7.
2023-10-06 07:32:25 +00:00
Stav:
Existuje model Marian NMT rep korekciu.
2023-07-03 14:21:08 +00:00
2023-07-03 14:26:05 +00:00
2023-10-06 07:32:25 +00:00
Úloha:
2023-07-03 14:21:08 +00:00
2023-10-06 07:32:25 +00:00
- [-] Zistite ako funguje neurónová sieť typu Transformer.
2023-11-23 12:40:16 +00:00
- [x] Nainštalujte si systém Anaconda a prejdite si knihu Dive into Pyhton 3.
2023-10-06 07:32:25 +00:00
- [ ] Zistite ako funguje strojový preklad.
2023-11-23 12:40:16 +00:00
- [x] Prečítajte si článok Hládek: "Survey of Automatic Spelling Correction" a *urobte si poznámky* .
2023-11-23 13:01:12 +00:00
- [-] Prečítajte si knihu https://d2l.ai/
2023-10-06 07:32:25 +00:00
- [ ] Vaše zistenia zapíšte do textového súboru. Pridajte odkazy na zdroje - odborné články a blogy.
- [ ] Oboznámiť sa zo systémom Marian NMT. Nainštalujte si to a vyskúšajte nejaké demo na strojový preklad.
- [ ] Získajte prístup na školský server idoc.
2023-07-03 14:21:08 +00:00
2023-07-03 14:26:05 +00:00
Zásobník úloh:
2023-07-03 14:21:08 +00:00
- Vyskúšaje natrénovať model Marian NMT podľa návodu na stránke.
- Získajte od vedúceho skripty pre trénovanie Marian NMT na úlohu korekcie textu.
- Podľa nich natrénujte a vyhodnotte model.
- Zistite s akými parametrami model pracuje najlepšie. Skúste model vylepšiť.
- Vypracujte webové demo.