forked from KEMT/zpwiki
		
	zz
This commit is contained in:
		
							parent
							
								
									1162e335f9
								
							
						
					
					
						commit
						1a6d215f89
					
				@ -15,4 +15,23 @@ rok začiatku štúdia: 2021
 | 
			
		||||
Klasifikácia webových dát pre lepšie jazykové modelovanie
 | 
			
		||||
 | 
			
		||||
 | 
			
		||||
Cieľ je lepšie pripraviť webové dáta na trénovanie jazykového modelu.
 | 
			
		||||
 | 
			
		||||
 | 
			
		||||
Stretnutie:
 | 
			
		||||
 | 
			
		||||
Úlohy:
 | 
			
		||||
 | 
			
		||||
- Naučte sa Python. Nainštalujte si prostredie Anaconda. 
 | 
			
		||||
- Naučte sa pracovať s knižnicou Transformers a HuggingFace Hub- prejdite si jeden alebo 2 tutoriály na klasifikáciu textu.
 | 
			
		||||
- Zistitee čo je to jazykový model a urobte si poznámky. 
 | 
			
		||||
- Pozrite si knihu Deep Dive into Deep Learning a napíšte si poznámky.
 | 
			
		||||
- Zistite, ako funguje neurónová sieť typu Transformer a napíšte si poznámky.
 | 
			
		||||
- Zistite, čo je to korpus textov mc4. 
 | 
			
		||||
- Zistite, ako funguje klasifikácia textov pomocou Transformera. Zisite, čo je to tokenizácia. 
 | 
			
		||||
 | 
			
		||||
Zásobník úloh:
 | 
			
		||||
 | 
			
		||||
- Vytovrte množinu príkladov textov z webu a zotriedte ich podľa kvality a druhu.
 | 
			
		||||
- Natrénujte neurónovú sieť pre rozlišovanie druhov textov.
 | 
			
		||||
 | 
			
		||||
 | 
			
		||||
		Loading…
	
		Reference in New Issue
	
	Block a user