forked from KEMT/zpwiki
		
	Update 'pages/students/2016/tomas_kucharik/README.md'
This commit is contained in:
		
							parent
							
								
									3723890118
								
							
						
					
					
						commit
						ae2e5f17a6
					
				@ -20,6 +20,41 @@ Anotácia pomocou systému [Prodigy](https://prodi.gy/docs)
 | 
			
		||||
- Navrhnúť pracovný postup pre využitie modelu pri ďalšej anotácii
 | 
			
		||||
- Možno: natrénovať model z anglických alebo slovenských dát.
 | 
			
		||||
 | 
			
		||||
Zásobník úloh:
 | 
			
		||||
 | 
			
		||||
- Vytvorte skript pre transformáciu výsledkov anotácie odpovedí do formátu [SQUAD 2:0](https://rajpurkar.github.io/SQuAD-explorer/)
 | 
			
		||||
- Oboznámte sa s relačnou databázovou schémou Prodigy.
 | 
			
		||||
 | 
			
		||||
Virtuálne stretnutie 14.5.
 | 
			
		||||
 | 
			
		||||
Urobené: modifikované skripty wikirank a getbestwiki,ly
 | 
			
		||||
Nová úloha: Vytvoriť skript pre analýzu DB schémy a zistenie kto anotoval koľko
 | 
			
		||||
- naprv konzolový skript, potom web aplikácia napr. Flask, 
 | 
			
		||||
 | 
			
		||||
Revízia 16.4:2020:
 | 
			
		||||
 | 
			
		||||
- Predbežné výstupy (wikipedia parser) v repozitári https://git.kemt.fei.tuke.sk/tk634rv/dp2021
 | 
			
		||||
- Vytvorený prístup na server omega
 | 
			
		||||
 | 
			
		||||
Nové úlohy:
 | 
			
		||||
 | 
			
		||||
- Oboznámte sa s obsahom [spoločného repozitára]( https://git.kemt.fei.tuke.sk/dano/annotation), stručná dokumentácia sa nachádza v súboroch README.md a v shell skriptoch.
 | 
			
		||||
- Spustite si a vyskúšajte navrhnutú anotačnú schému pre vytváranie otázok a odpovedí.
 | 
			
		||||
- Modifikujte skript wikirank.py a vyraďte z výpočtu stránky ktoré majú v názve číslo alebo dvojbodku. Výsledky PageRank uložte vo formáte JSONL
 | 
			
		||||
- Vytvorte skript, ktorý vyberie stránky s najlepším PageRank a z nich vytvorí korpus vhodný na anotáciu otázok.
 | 
			
		||||
- Dôsledne komunikujte Vaše výsledky alebo problémy na ktoré ste narazili.
 | 
			
		||||
 | 
			
		||||
 | 
			
		||||
Revízia 9.4.2020:
 | 
			
		||||
 | 
			
		||||
Nové úlohy:
 | 
			
		||||
 | 
			
		||||
- Nainštalujte si anotačnú aplikáciu https://git.kemt.fei.tuke.sk/dano/annotation
 | 
			
		||||
- Pozrite si recepty v adresári "question_answer".
 | 
			
		||||
- Podľa vzoru vytvorte korpus paragrafov zo slovenskej  Wikipédie vhodných na anotovanie otázok.
 | 
			
		||||
 | 
			
		||||
 | 
			
		||||
 | 
			
		||||
Úvodné stretnutie 6.3.2020.
 | 
			
		||||
 | 
			
		||||
Porozmýšľať:
 | 
			
		||||
@ -37,37 +72,5 @@ Vytvorený spoločný repozitár https://git.kemt.fei.tuke.sk/dano/annotation
 | 
			
		||||
- Oboznámiť sa s https://github.com/5hirish/adam_qas
 | 
			
		||||
- Oboznámte sa s frameworkom Spacy a Prodigy.
 | 
			
		||||
 | 
			
		||||
Revízia 9.4.2020:
 | 
			
		||||
 | 
			
		||||
Nové úlohy:
 | 
			
		||||
 | 
			
		||||
- Nainštalujte si anotačnú aplikáciu https://git.kemt.fei.tuke.sk/dano/annotation
 | 
			
		||||
- Pozrite si recepty v adresári "question_answer".
 | 
			
		||||
- Podľa vzoru vytvorte korpus paragrafov zo slovenskej  Wikipédie vhodných na anotovanie otázok.
 | 
			
		||||
 | 
			
		||||
Revízia 16.4:2020:
 | 
			
		||||
 | 
			
		||||
- Predbežné výstupy (wikipedia parser) v repozitári https://git.kemt.fei.tuke.sk/tk634rv/dp2021
 | 
			
		||||
- Vytvorený prístup na server omega
 | 
			
		||||
 | 
			
		||||
Nové úlohy:
 | 
			
		||||
 | 
			
		||||
- Oboznámte sa s obsahom [spoločného repozitára]( https://git.kemt.fei.tuke.sk/dano/annotation), stručná dokumentácia sa nachádza v súboroch README.md a v shell skriptoch.
 | 
			
		||||
- Spustite si a vyskúšajte navrhnutú anotačnú schému pre vytváranie otázok a odpovedí.
 | 
			
		||||
- Modifikujte skript wikirank.py a vyraďte z výpočtu stránky ktoré majú v názve číslo alebo dvojbodku. Výsledky PageRank uložte vo formáte JSONL
 | 
			
		||||
- Vytvorte skript, ktorý vyberie stránky s najlepším PageRank a z nich vytvorí korpus vhodný na anotáciu otázok.
 | 
			
		||||
- Dôsledne komunikujte Vaše výsledky alebo problémy na ktoré ste narazili.
 | 
			
		||||
 | 
			
		||||
Zásobník úloh:
 | 
			
		||||
 | 
			
		||||
- Vytvorte skript pre transformáciu výsledkov anotácie odpovedí do formátu [SQUAD 2:0](https://rajpurkar.github.io/SQuAD-explorer/)
 | 
			
		||||
- Oboznámte sa s relačnou databázovou schémou Prodigy.
 | 
			
		||||
 | 
			
		||||
Virtuálne stretnutie 14.5.
 | 
			
		||||
 | 
			
		||||
Urobené: modifikované skripty wikirank a getbestwiki,ly
 | 
			
		||||
Nová úloha: Vytvoriť skript pre analýzu DB schémy a zistenie kto anotoval koľko
 | 
			
		||||
- naprv konzolový skript, potom web aplikácia napr. Flask, 
 | 
			
		||||
 | 
			
		||||
 
 | 
			
		||||
 | 
			
		||||
 | 
			
		||||
		Loading…
	
		Reference in New Issue
	
	Block a user