From ae2e5f17a63d54101c6732b20b6642f1105f922f Mon Sep 17 00:00:00 2001 From: dano Date: Fri, 26 Jun 2020 07:31:53 +0000 Subject: [PATCH] Update 'pages/students/2016/tomas_kucharik/README.md' --- pages/students/2016/tomas_kucharik/README.md | 67 ++++++++++---------- 1 file changed, 35 insertions(+), 32 deletions(-) diff --git a/pages/students/2016/tomas_kucharik/README.md b/pages/students/2016/tomas_kucharik/README.md index 5f91046b..b63e73a1 100644 --- a/pages/students/2016/tomas_kucharik/README.md +++ b/pages/students/2016/tomas_kucharik/README.md @@ -20,6 +20,41 @@ Anotácia pomocou systému [Prodigy](https://prodi.gy/docs) - Navrhnúť pracovný postup pre využitie modelu pri ďalšej anotácii - Možno: natrénovať model z anglických alebo slovenských dát. +Zásobník úloh: + +- Vytvorte skript pre transformáciu výsledkov anotácie odpovedí do formátu [SQUAD 2:0](https://rajpurkar.github.io/SQuAD-explorer/) +- Oboznámte sa s relačnou databázovou schémou Prodigy. + +Virtuálne stretnutie 14.5. + +Urobené: modifikované skripty wikirank a getbestwiki,ly +Nová úloha: Vytvoriť skript pre analýzu DB schémy a zistenie kto anotoval koľko +- naprv konzolový skript, potom web aplikácia napr. Flask, + +Revízia 16.4:2020: + +- Predbežné výstupy (wikipedia parser) v repozitári https://git.kemt.fei.tuke.sk/tk634rv/dp2021 +- Vytvorený prístup na server omega + +Nové úlohy: + +- Oboznámte sa s obsahom [spoločného repozitára]( https://git.kemt.fei.tuke.sk/dano/annotation), stručná dokumentácia sa nachádza v súboroch README.md a v shell skriptoch. +- Spustite si a vyskúšajte navrhnutú anotačnú schému pre vytváranie otázok a odpovedí. +- Modifikujte skript wikirank.py a vyraďte z výpočtu stránky ktoré majú v názve číslo alebo dvojbodku. Výsledky PageRank uložte vo formáte JSONL +- Vytvorte skript, ktorý vyberie stránky s najlepším PageRank a z nich vytvorí korpus vhodný na anotáciu otázok. +- Dôsledne komunikujte Vaše výsledky alebo problémy na ktoré ste narazili. + + +Revízia 9.4.2020: + +Nové úlohy: + +- Nainštalujte si anotačnú aplikáciu https://git.kemt.fei.tuke.sk/dano/annotation +- Pozrite si recepty v adresári "question_answer". +- Podľa vzoru vytvorte korpus paragrafov zo slovenskej Wikipédie vhodných na anotovanie otázok. + + + Úvodné stretnutie 6.3.2020. Porozmýšľať: @@ -37,37 +72,5 @@ Vytvorený spoločný repozitár https://git.kemt.fei.tuke.sk/dano/annotation - Oboznámiť sa s https://github.com/5hirish/adam_qas - Oboznámte sa s frameworkom Spacy a Prodigy. -Revízia 9.4.2020: -Nové úlohy: - -- Nainštalujte si anotačnú aplikáciu https://git.kemt.fei.tuke.sk/dano/annotation -- Pozrite si recepty v adresári "question_answer". -- Podľa vzoru vytvorte korpus paragrafov zo slovenskej Wikipédie vhodných na anotovanie otázok. - -Revízia 16.4:2020: - -- Predbežné výstupy (wikipedia parser) v repozitári https://git.kemt.fei.tuke.sk/tk634rv/dp2021 -- Vytvorený prístup na server omega - -Nové úlohy: - -- Oboznámte sa s obsahom [spoločného repozitára]( https://git.kemt.fei.tuke.sk/dano/annotation), stručná dokumentácia sa nachádza v súboroch README.md a v shell skriptoch. -- Spustite si a vyskúšajte navrhnutú anotačnú schému pre vytváranie otázok a odpovedí. -- Modifikujte skript wikirank.py a vyraďte z výpočtu stránky ktoré majú v názve číslo alebo dvojbodku. Výsledky PageRank uložte vo formáte JSONL -- Vytvorte skript, ktorý vyberie stránky s najlepším PageRank a z nich vytvorí korpus vhodný na anotáciu otázok. -- Dôsledne komunikujte Vaše výsledky alebo problémy na ktoré ste narazili. - -Zásobník úloh: - -- Vytvorte skript pre transformáciu výsledkov anotácie odpovedí do formátu [SQUAD 2:0](https://rajpurkar.github.io/SQuAD-explorer/) -- Oboznámte sa s relačnou databázovou schémou Prodigy. - -Virtuálne stretnutie 14.5. - -Urobené: modifikované skripty wikirank a getbestwiki,ly -Nová úloha: Vytvoriť skript pre analýzu DB schémy a zistenie kto anotoval koľko -- naprv konzolový skript, potom web aplikácia napr. Flask, - -