forked from KEMT/zpwiki
Update 'pages/students/2016/tomas_kucharik/README.md'
This commit is contained in:
parent
3723890118
commit
ae2e5f17a6
@ -20,6 +20,41 @@ Anotácia pomocou systému [Prodigy](https://prodi.gy/docs)
|
||||
- Navrhnúť pracovný postup pre využitie modelu pri ďalšej anotácii
|
||||
- Možno: natrénovať model z anglických alebo slovenských dát.
|
||||
|
||||
Zásobník úloh:
|
||||
|
||||
- Vytvorte skript pre transformáciu výsledkov anotácie odpovedí do formátu [SQUAD 2:0](https://rajpurkar.github.io/SQuAD-explorer/)
|
||||
- Oboznámte sa s relačnou databázovou schémou Prodigy.
|
||||
|
||||
Virtuálne stretnutie 14.5.
|
||||
|
||||
Urobené: modifikované skripty wikirank a getbestwiki,ly
|
||||
Nová úloha: Vytvoriť skript pre analýzu DB schémy a zistenie kto anotoval koľko
|
||||
- naprv konzolový skript, potom web aplikácia napr. Flask,
|
||||
|
||||
Revízia 16.4:2020:
|
||||
|
||||
- Predbežné výstupy (wikipedia parser) v repozitári https://git.kemt.fei.tuke.sk/tk634rv/dp2021
|
||||
- Vytvorený prístup na server omega
|
||||
|
||||
Nové úlohy:
|
||||
|
||||
- Oboznámte sa s obsahom [spoločného repozitára]( https://git.kemt.fei.tuke.sk/dano/annotation), stručná dokumentácia sa nachádza v súboroch README.md a v shell skriptoch.
|
||||
- Spustite si a vyskúšajte navrhnutú anotačnú schému pre vytváranie otázok a odpovedí.
|
||||
- Modifikujte skript wikirank.py a vyraďte z výpočtu stránky ktoré majú v názve číslo alebo dvojbodku. Výsledky PageRank uložte vo formáte JSONL
|
||||
- Vytvorte skript, ktorý vyberie stránky s najlepším PageRank a z nich vytvorí korpus vhodný na anotáciu otázok.
|
||||
- Dôsledne komunikujte Vaše výsledky alebo problémy na ktoré ste narazili.
|
||||
|
||||
|
||||
Revízia 9.4.2020:
|
||||
|
||||
Nové úlohy:
|
||||
|
||||
- Nainštalujte si anotačnú aplikáciu https://git.kemt.fei.tuke.sk/dano/annotation
|
||||
- Pozrite si recepty v adresári "question_answer".
|
||||
- Podľa vzoru vytvorte korpus paragrafov zo slovenskej Wikipédie vhodných na anotovanie otázok.
|
||||
|
||||
|
||||
|
||||
Úvodné stretnutie 6.3.2020.
|
||||
|
||||
Porozmýšľať:
|
||||
@ -37,37 +72,5 @@ Vytvorený spoločný repozitár https://git.kemt.fei.tuke.sk/dano/annotation
|
||||
- Oboznámiť sa s https://github.com/5hirish/adam_qas
|
||||
- Oboznámte sa s frameworkom Spacy a Prodigy.
|
||||
|
||||
Revízia 9.4.2020:
|
||||
|
||||
Nové úlohy:
|
||||
|
||||
- Nainštalujte si anotačnú aplikáciu https://git.kemt.fei.tuke.sk/dano/annotation
|
||||
- Pozrite si recepty v adresári "question_answer".
|
||||
- Podľa vzoru vytvorte korpus paragrafov zo slovenskej Wikipédie vhodných na anotovanie otázok.
|
||||
|
||||
Revízia 16.4:2020:
|
||||
|
||||
- Predbežné výstupy (wikipedia parser) v repozitári https://git.kemt.fei.tuke.sk/tk634rv/dp2021
|
||||
- Vytvorený prístup na server omega
|
||||
|
||||
Nové úlohy:
|
||||
|
||||
- Oboznámte sa s obsahom [spoločného repozitára]( https://git.kemt.fei.tuke.sk/dano/annotation), stručná dokumentácia sa nachádza v súboroch README.md a v shell skriptoch.
|
||||
- Spustite si a vyskúšajte navrhnutú anotačnú schému pre vytváranie otázok a odpovedí.
|
||||
- Modifikujte skript wikirank.py a vyraďte z výpočtu stránky ktoré majú v názve číslo alebo dvojbodku. Výsledky PageRank uložte vo formáte JSONL
|
||||
- Vytvorte skript, ktorý vyberie stránky s najlepším PageRank a z nich vytvorí korpus vhodný na anotáciu otázok.
|
||||
- Dôsledne komunikujte Vaše výsledky alebo problémy na ktoré ste narazili.
|
||||
|
||||
Zásobník úloh:
|
||||
|
||||
- Vytvorte skript pre transformáciu výsledkov anotácie odpovedí do formátu [SQUAD 2:0](https://rajpurkar.github.io/SQuAD-explorer/)
|
||||
- Oboznámte sa s relačnou databázovou schémou Prodigy.
|
||||
|
||||
Virtuálne stretnutie 14.5.
|
||||
|
||||
Urobené: modifikované skripty wikirank a getbestwiki,ly
|
||||
Nová úloha: Vytvoriť skript pre analýzu DB schémy a zistenie kto anotoval koľko
|
||||
- naprv konzolový skript, potom web aplikácia napr. Flask,
|
||||
|
||||
|
||||
|
||||
|
Loading…
Reference in New Issue
Block a user