Update 'pages/students/2018/martin_wencel/README.md'

This commit is contained in:
dano 2021-02-02 12:55:40 +00:00
parent 0e266b1e92
commit fb0efb504a

View File

@ -24,17 +24,20 @@ Cieľ:
Výstupy:
- Aplikácia vie robiť pomocou spacy tokenizácia, morfologická analýza, parsing a named entity recognition pre slovenčinu a angličtinu.
- [Zdrojové kódy](https://git.kemt.fei.tuke.sk/mw223on/bp2020/)
Zásobník úloh:
- Vymyslite a doplňte REST API pre služby knižnice Spacy. Cieľ je vedieť využiť Spacy pomocou curl, alebo pythonu cez HTTP na spracovane textových súborov.
- Vymyslieť ako spracovať väčšie textové súbory pomocou REST API alebo podobného?
Návrh na zadanie:
1. Vyberte a naštudujte metódu spracovania prirodzeného jazyka.
1. Vypracujte teoretický úvod do zvolenej metódy spracovania prirodzeného jazyka.
1. Vytvorte demonštračnú webovú aplikáciu pomocou ktorej je možné vyskúšať zvolenú metódu.
1. Vypracujte teoretický úvod do spracovania prirodzeného slovenského jazyka. Vysvetlite čo to je parsing, morfologická analýza a rozpoznávanie pomenovaných entít a akými metódami sa vykonávajú.
1. Podrobne vysvetlite, ako pracuje parsing, morfologická analýza a rozpoznávanie pomenovaných entít v knižnici Spacy.
1. Natrénujte a vyhodnoťte model pre spracovanie slovenského a anglického jazyka v knižnici Spacy.
1. Vytvorte demonštračnú webovú aplikáciu pomocou ktorej je možné vyskúšať natrénované modely.
1. Navrhnite možné zlepšenia Vami vytvorenej aplikácie.
@ -42,6 +45,7 @@ Stretnutie:
- Práca na frontende
- Dorobená slovenčina - prerobené spacy explain. Vysvetľuje tagy.
- Urobené rozhranie na spracovanie súborov.
Virtuálne stretnutie 15.12.:
@ -50,13 +54,14 @@ Stav:
- Pripravený Docker deployment.
- Aplikácia funguje pre anglický jazyk.
- Práca na písomenj časti
- Práca na písomnej časti
Do ďalšieho stretnutia:
- Dorobiť slovenčinu
- Zlepšiť dizajn
- Vymyslite a doplňte REST API pre služby knižnice Spacy. Cieľ je vedieť využiť Spacy pomocou curl, alebo pythonu cez HTTP na spracovane väčších textových súborov.