forked from KEMT/zpwiki
		
	Update 'pages/students/2019/michal_stromko/README.md'
This commit is contained in:
		
							parent
							
								
									2278572956
								
							
						
					
					
						commit
						cac1df1b02
					
				@ -28,6 +28,35 @@ Ciele DP:
 | 
				
			|||||||
- Porovnať viacero metód na vyhľadávanie v slovenskom texte - BM25, TF IDF, WordEmbedding, SentenceTransformers, Alebo iné embeddingy.
 | 
					- Porovnať viacero metód na vyhľadávanie v slovenskom texte - BM25, TF IDF, WordEmbedding, SentenceTransformers, Alebo iné embeddingy.
 | 
				
			||||||
 | 
					
 | 
				
			||||||
# Diplomový projekt 2
 | 
					# Diplomový projekt 2
 | 
				
			||||||
 | 
					Stretnutie 9.11. 2023
 | 
				
			||||||
 | 
					
 | 
				
			||||||
 | 
					Stav - urobené úlohy: 
 | 
				
			||||||
 | 
					- Je anotovaných cca 240 otázok, ku každej cca 20 dokumentov
 | 
				
			||||||
 | 
					- [x]   Pridať kódy na Git
 | 
				
			||||||
 | 
					- [x]  Napísať návod pre anotovanie
 | 
				
			||||||
 | 
					- [x]  Spaviť jednu stránku pre vypísanie počtu už anotovaných otázok z danej sady
 | 
				
			||||||
 | 
					- [x]  Pridať do indexu search, každému kontextu ID
 | 
				
			||||||
 | 
					- [x]  Pri vyhľadávaní sprrávnych odpovedí uložiť uložiť tak, aby bol súbor odpovede, ktorý bude mať parametere id_odpovede a k nemu priradený text odpovede
 | 
				
			||||||
 | 
					- [x]  Rozdelenie anotačného datasetu na sady (anotačné sady je ich 8)
 | 
				
			||||||
 | 
					- [x]  Zamiešanie správnych odpovedí okrem odpovede zo skquad tá je na index = 0 vždy
 | 
				
			||||||
 | 
					- [x]  Prerobiť anotačnú aplikáciu tak, aby mala po anotovaní štruktúru id správnej odpovede a kategóriu.
 | 
				
			||||||
 | 
					- [x]  Pri anotovaní budem ťahať z id odpovede presný text z toho datasetu
 | 
				
			||||||
 | 
					- [x]  Anotovacie kategórie: sú na gite skwiki
 | 
				
			||||||
 | 
					- [x]  Zapísať nové veci a poznámky do Mira
 | 
				
			||||||
 | 
					- [x]  Zmeniť v Mire štruktúru anotačného aj finálneho datasetu
 | 
				
			||||||
 | 
					- [x]  Opovedí môže byť rôzne množstvo nie iba po jednej odpove
 | 
				
			||||||
 | 
					
 | 
				
			||||||
 | 
					Úlohy:
 | 
				
			||||||
 | 
					
 | 
				
			||||||
 | 
					- Pokračovať v anotácia prvých a druhých 1000 otázok
 | 
				
			||||||
 | 
					- Pripraviť experimenty pre vyhodnotenie presnosti s novými dátami
 | 
				
			||||||
 | 
					- Pokračovať v písaní.
 | 
				
			||||||
 | 
					
 | 
				
			||||||
 | 
					Zásobník úloh:
 | 
				
			||||||
 | 
					
 | 
				
			||||||
 | 
					- Zvážiť indexovať kratšie kontexty. Nevýhody: vznikne neporiadok. Výhody: Môže sa urýchliť práca anotátorov. 
 | 
				
			||||||
 | 
					- Zvážiť nasadenie, úpravu django appky a anotovať s náhodnými študentami.
 | 
				
			||||||
 | 
					
 | 
				
			||||||
 | 
					
 | 
				
			||||||
Stretnutie 2.11.2023
 | 
					Stretnutie 2.11.2023
 | 
				
			||||||
 | 
					
 | 
				
			||||||
 | 
				
			|||||||
		Loading…
	
		Reference in New Issue
	
	Block a user