diff --git a/pages/students/2016/tomas_kucharik/README.md b/pages/students/2016/tomas_kucharik/README.md index 003c35ee1..1afacb604 100644 --- a/pages/students/2016/tomas_kucharik/README.md +++ b/pages/students/2016/tomas_kucharik/README.md @@ -52,10 +52,15 @@ Revízia 16.4:2020: Nové úlohy: -- Oboznámte sa s obsahom [spoločného repozitára]( https://git.kemt.fei.tuke.sk/dano/annotation). +- Oboznámte sa s obsahom [spoločného repozitára]( https://git.kemt.fei.tuke.sk/dano/annotation), stručná dokumentácia sa nachádza v súboroch README.md a v shell skriptoch. - Spustite si a vyskúšajte navrhnutú anotačnú schému pre vytváranie otázok a odpovedí. +- Modifikujte skript wikirank.py a vyraďte z výpočtu stránky ktoré majú v názve číslo alebo dvojbodku. Výsledky PageRank uložte vo formáte JSONL +- Vytvorte skript, ktorý vyberie stránky s najlepším PageRank a z nich vytvorí korpus vhodný na anotáciu otázok. +- Dôsledne komunikujte Vaše výsledky alebo problémy na ktoré ste narazili. + +Zásobník úloh: + +- Vytvorte skript pre transformáciu výsledkov anotácie odpovedí do formátu [SQUAD 2:0](https://rajpurkar.github.io/SQuAD-explorer/) - Oboznámte sa s relačnou databázovou schémou Prodigy. -- Vytvorte skript pre transformáciu výsledkov anotáciue odpovedí do formátu [SQUAD 2:0](https://rajpurkar.github.io/SQuAD-explorer/) -- Dôsledne komunikujte Vaše výsledky alebo problémy na ktoré ste narazili