diff --git a/pages/students/2016/maros_harahus/README.md b/pages/students/2016/maros_harahus/README.md index fd8fddd395..3a1112f49c 100644 --- a/pages/students/2016/maros_harahus/README.md +++ b/pages/students/2016/maros_harahus/README.md @@ -14,6 +14,25 @@ Doplnenie podpory morfologického značkovania slovenského jazyka do nlp framew - Oboznámte sa so sadou SNK https://korpus.sk/morpho.html - Natrénovať Spacy Model s POS a s pretrénovaním + +Revízia 9.4.2020: + +Report o doterajšej práci: + +- naštudovanie Fasttext +- implementácia do Spacy +- úprava modelu v spacy na rozpoznanie jazyka +- snaha o spacy-udpipe pre non-English text + +Nové úlohy: + +- pridajte zdrojový text a odkaz na "implementáciu". +- natrénujte model podľa https://git.kemt.fei.tuke.sk/dano/spacy-skmodel +- skúste pridať "word-embeddingy" z fasttext do trénovania. +- vyhodnoťte natrénovaný model - zistite presnosť značkovania. Aký vplyv majú embeddingy na presnosť? +- porozmýšľajte ako sa dá presnosť zlepšiť. + + Stretnutie 5.3.2020: Úlohy na ďalšie stretnutie: @@ -40,22 +59,6 @@ Stretnutie: 20.2.2020: - Nájsť spôsob ako využiť existujúci model word embedding pri trénovaní https://fasttext.cc/docs/en/pretrained-vectors.html - Ako natrénovať Spacy POS model? -Revízia 9.4.2020: - -Report o doterajšej práci: - -- naštudovanie Fasttext -- implementácia do Spacy -- úprava modelu v spacy na rozpoznanie jazyka -- snaha o spacy-udpipe pre non-English text - -Nové úlohy: - -- pridajte zdrojový text a odkaz na "implementáciu". -- natrénujte model podľa https://git.kemt.fei.tuke.sk/dano/spacy-skmodel -- skúste pridať "word-embeddingy" z fasttext do trénovania. -- vyhodnoťte natrénovaný model - zistite presnosť značkovania. Aký vplyv majú embeddingy na presnosť? -- porozmýšľajte ako sa dá presnosť zlepšiť.