forked from KEMT/zpwiki
Update 'pages/students/2016/tomas_kucharik/README.md'
This commit is contained in:
parent
3723890118
commit
ae2e5f17a6
@ -20,6 +20,41 @@ Anotácia pomocou systému [Prodigy](https://prodi.gy/docs)
|
|||||||
- Navrhnúť pracovný postup pre využitie modelu pri ďalšej anotácii
|
- Navrhnúť pracovný postup pre využitie modelu pri ďalšej anotácii
|
||||||
- Možno: natrénovať model z anglických alebo slovenských dát.
|
- Možno: natrénovať model z anglických alebo slovenských dát.
|
||||||
|
|
||||||
|
Zásobník úloh:
|
||||||
|
|
||||||
|
- Vytvorte skript pre transformáciu výsledkov anotácie odpovedí do formátu [SQUAD 2:0](https://rajpurkar.github.io/SQuAD-explorer/)
|
||||||
|
- Oboznámte sa s relačnou databázovou schémou Prodigy.
|
||||||
|
|
||||||
|
Virtuálne stretnutie 14.5.
|
||||||
|
|
||||||
|
Urobené: modifikované skripty wikirank a getbestwiki,ly
|
||||||
|
Nová úloha: Vytvoriť skript pre analýzu DB schémy a zistenie kto anotoval koľko
|
||||||
|
- naprv konzolový skript, potom web aplikácia napr. Flask,
|
||||||
|
|
||||||
|
Revízia 16.4:2020:
|
||||||
|
|
||||||
|
- Predbežné výstupy (wikipedia parser) v repozitári https://git.kemt.fei.tuke.sk/tk634rv/dp2021
|
||||||
|
- Vytvorený prístup na server omega
|
||||||
|
|
||||||
|
Nové úlohy:
|
||||||
|
|
||||||
|
- Oboznámte sa s obsahom [spoločného repozitára]( https://git.kemt.fei.tuke.sk/dano/annotation), stručná dokumentácia sa nachádza v súboroch README.md a v shell skriptoch.
|
||||||
|
- Spustite si a vyskúšajte navrhnutú anotačnú schému pre vytváranie otázok a odpovedí.
|
||||||
|
- Modifikujte skript wikirank.py a vyraďte z výpočtu stránky ktoré majú v názve číslo alebo dvojbodku. Výsledky PageRank uložte vo formáte JSONL
|
||||||
|
- Vytvorte skript, ktorý vyberie stránky s najlepším PageRank a z nich vytvorí korpus vhodný na anotáciu otázok.
|
||||||
|
- Dôsledne komunikujte Vaše výsledky alebo problémy na ktoré ste narazili.
|
||||||
|
|
||||||
|
|
||||||
|
Revízia 9.4.2020:
|
||||||
|
|
||||||
|
Nové úlohy:
|
||||||
|
|
||||||
|
- Nainštalujte si anotačnú aplikáciu https://git.kemt.fei.tuke.sk/dano/annotation
|
||||||
|
- Pozrite si recepty v adresári "question_answer".
|
||||||
|
- Podľa vzoru vytvorte korpus paragrafov zo slovenskej Wikipédie vhodných na anotovanie otázok.
|
||||||
|
|
||||||
|
|
||||||
|
|
||||||
Úvodné stretnutie 6.3.2020.
|
Úvodné stretnutie 6.3.2020.
|
||||||
|
|
||||||
Porozmýšľať:
|
Porozmýšľať:
|
||||||
@ -37,37 +72,5 @@ Vytvorený spoločný repozitár https://git.kemt.fei.tuke.sk/dano/annotation
|
|||||||
- Oboznámiť sa s https://github.com/5hirish/adam_qas
|
- Oboznámiť sa s https://github.com/5hirish/adam_qas
|
||||||
- Oboznámte sa s frameworkom Spacy a Prodigy.
|
- Oboznámte sa s frameworkom Spacy a Prodigy.
|
||||||
|
|
||||||
Revízia 9.4.2020:
|
|
||||||
|
|
||||||
Nové úlohy:
|
|
||||||
|
|
||||||
- Nainštalujte si anotačnú aplikáciu https://git.kemt.fei.tuke.sk/dano/annotation
|
|
||||||
- Pozrite si recepty v adresári "question_answer".
|
|
||||||
- Podľa vzoru vytvorte korpus paragrafov zo slovenskej Wikipédie vhodných na anotovanie otázok.
|
|
||||||
|
|
||||||
Revízia 16.4:2020:
|
|
||||||
|
|
||||||
- Predbežné výstupy (wikipedia parser) v repozitári https://git.kemt.fei.tuke.sk/tk634rv/dp2021
|
|
||||||
- Vytvorený prístup na server omega
|
|
||||||
|
|
||||||
Nové úlohy:
|
|
||||||
|
|
||||||
- Oboznámte sa s obsahom [spoločného repozitára]( https://git.kemt.fei.tuke.sk/dano/annotation), stručná dokumentácia sa nachádza v súboroch README.md a v shell skriptoch.
|
|
||||||
- Spustite si a vyskúšajte navrhnutú anotačnú schému pre vytváranie otázok a odpovedí.
|
|
||||||
- Modifikujte skript wikirank.py a vyraďte z výpočtu stránky ktoré majú v názve číslo alebo dvojbodku. Výsledky PageRank uložte vo formáte JSONL
|
|
||||||
- Vytvorte skript, ktorý vyberie stránky s najlepším PageRank a z nich vytvorí korpus vhodný na anotáciu otázok.
|
|
||||||
- Dôsledne komunikujte Vaše výsledky alebo problémy na ktoré ste narazili.
|
|
||||||
|
|
||||||
Zásobník úloh:
|
|
||||||
|
|
||||||
- Vytvorte skript pre transformáciu výsledkov anotácie odpovedí do formátu [SQUAD 2:0](https://rajpurkar.github.io/SQuAD-explorer/)
|
|
||||||
- Oboznámte sa s relačnou databázovou schémou Prodigy.
|
|
||||||
|
|
||||||
Virtuálne stretnutie 14.5.
|
|
||||||
|
|
||||||
Urobené: modifikované skripty wikirank a getbestwiki,ly
|
|
||||||
Nová úloha: Vytvoriť skript pre analýzu DB schémy a zistenie kto anotoval koľko
|
|
||||||
- naprv konzolový skript, potom web aplikácia napr. Flask,
|
|
||||||
|
|
||||||
|
|
||||||
|
|
||||||
|
Loading…
Reference in New Issue
Block a user