diff --git a/pages/students/2018/martin_wencel/README.md b/pages/students/2018/martin_wencel/README.md index 63aad58ab0..cb0c4f3f84 100644 --- a/pages/students/2018/martin_wencel/README.md +++ b/pages/students/2018/martin_wencel/README.md @@ -24,17 +24,20 @@ Cieľ: Výstupy: +- Aplikácia vie robiť pomocou spacy tokenizácia, morfologická analýza, parsing a named entity recognition pre slovenčinu a angličtinu. - [Zdrojové kódy](https://git.kemt.fei.tuke.sk/mw223on/bp2020/) - - +Zásobník úloh: +- Vymyslite a doplňte REST API pre služby knižnice Spacy. Cieľ je vedieť využiť Spacy pomocou curl, alebo pythonu cez HTTP na spracovane textových súborov. +- Vymyslieť ako spracovať väčšie textové súbory pomocou REST API alebo podobného? Návrh na zadanie: -1. Vyberte a naštudujte metódu spracovania prirodzeného jazyka. -1. Vypracujte teoretický úvod do zvolenej metódy spracovania prirodzeného jazyka. -1. Vytvorte demonštračnú webovú aplikáciu pomocou ktorej je možné vyskúšať zvolenú metódu. +1. Vypracujte teoretický úvod do spracovania prirodzeného slovenského jazyka. Vysvetlite čo to je parsing, morfologická analýza a rozpoznávanie pomenovaných entít a akými metódami sa vykonávajú. +1. Podrobne vysvetlite, ako pracuje parsing, morfologická analýza a rozpoznávanie pomenovaných entít v knižnici Spacy. +1. Natrénujte a vyhodnoťte model pre spracovanie slovenského a anglického jazyka v knižnici Spacy. +1. Vytvorte demonštračnú webovú aplikáciu pomocou ktorej je možné vyskúšať natrénované modely. 1. Navrhnite možné zlepšenia Vami vytvorenej aplikácie. @@ -42,6 +45,7 @@ Stretnutie: - Práca na frontende - Dorobená slovenčina - prerobené spacy explain. Vysvetľuje tagy. +- Urobené rozhranie na spracovanie súborov. Virtuálne stretnutie 15.12.: @@ -50,13 +54,14 @@ Stav: - Pripravený Docker deployment. - Aplikácia funguje pre anglický jazyk. -- Práca na písomenj časti +- Práca na písomnej časti + Do ďalšieho stretnutia: - Dorobiť slovenčinu - Zlepšiť dizajn -- Vymyslite a doplňte REST API pre služby knižnice Spacy. Cieľ je vedieť využiť Spacy pomocou curl, alebo pythonu cez HTTP na spracovane väčších textových súborov. +