forked from KEMT/zpwiki
		
	Update 'pages/students/2021/vladimir_ferko/README.md'
This commit is contained in:
		
							parent
							
								
									369543e606
								
							
						
					
					
						commit
						9a6c81083e
					
				@ -35,6 +35,27 @@ Predbežné zadanie - úlohy na semester:
 | 
			
		||||
- Možno anotovať nenávistnú reč. Toto konzultovať s p. Sokolovou.
 | 
			
		||||
- Z nazbieraných dát zostavte a vyhodnoťte model
 | 
			
		||||
 | 
			
		||||
Stretnutie 23.1.2024
 | 
			
		||||
 | 
			
		||||
Stav:
 | 
			
		||||
 | 
			
		||||
- Práca iba na textovej časti.
 | 
			
		||||
 | 
			
		||||
Úlohy:
 | 
			
		||||
 | 
			
		||||
- Pripravte dátovú množinu na anotovanie. Vyberte také dáta, ktoré obsahujú málo spamu a primerané množstvo "hatespeech". Môžete "nascrapovať" nové zdroje, také ktoré sú vhodnejšie.
 | 
			
		||||
- Pripravte aplikáciu na anotovanie a skúste anotovať pár jednotiek. Zaznamenajte chyby anotačnej aplikácie. 
 | 
			
		||||
- Ak bude aplikácia v poriadku, anotujte viac.
 | 
			
		||||
- Pokračujte v práci na textovej časti podľa inštrukcií nižšie.
 | 
			
		||||
- Pokračujte v otvorených úlohách. 
 | 
			
		||||
 | 
			
		||||
 | 
			
		||||
Zásobník úloh:
 | 
			
		||||
 | 
			
		||||
- Prečistenie databázy na výskyt spamu: Pomocou modelu slovak-bert-mnlr identifikujte sémanticky podobné dokumenty. Ak má jeden dokument príliš veľa podobných, označte ho ako spam.  Konzultovať s Stromko alebo Sopkovič. Asi bude treba použiť vektorový index. 
 | 
			
		||||
- Z anotovaných dát natrénujte model.
 | 
			
		||||
 | 
			
		||||
 | 
			
		||||
Stretnutie 27.10.2023
 | 
			
		||||
 | 
			
		||||
Stav:
 | 
			
		||||
 | 
			
		||||
		Loading…
	
		Reference in New Issue
	
	Block a user