diff --git a/pages/students/2016/jakub_maruniak/README.md b/pages/students/2016/jakub_maruniak/README.md index d385614a..bda14bcf 100644 --- a/pages/students/2016/jakub_maruniak/README.md +++ b/pages/students/2016/jakub_maruniak/README.md @@ -29,13 +29,16 @@ Návrh možných entít na anotáciu: - PRODUKT - INE -Revízia 9.4. +Revízia 9.4. a 17.4. Nové úlohy: -- Podľa https://git.kemt.fei.tuke.sk/dano/annotation vytvorte skript pre anotáciu slovenských pomenovaných entít. +- vytvorte skript pre anotáciu slovenských pomenovaných entít. + - Pozrite si https://prodi.gy/docs/named-entity-recognition (aj video) + - Spustite schému "Manual annotation with suggestions from a model" (použite aj [príklady](https://git.kemt.fei.tuke.sk/dano/annotation) - Ako zdroj dát použite https://git.kemt.fei.tuke.sk/dano/spacy-skmodel/src/branch/master/sources/skner/wikiann-sk.bio -- Uložte skript na GIT a pridajte odkaz do profilu + - Urobte skript, ktorý zmení wiki dáta do [spacy formátu](https://raw.githubusercontent.com/explosion/prodigy-recipes/master/example-datasets/raw_shares-newsapi.jsonl) + - Uložte skript na GIT a pridajte odkaz do profilu