forked from KEMT/zpwiki
		
	zz
This commit is contained in:
		
							parent
							
								
									40d1fb9075
								
							
						
					
					
						commit
						f9104754e6
					
				@ -1,11 +1,44 @@
 | 
			
		||||
# Jakub Maruniak
 | 
			
		||||
 | 
			
		||||
*Rok začiatku štúdia*: 2016
 | 
			
		||||
 | 
			
		||||
## Diplomový projekt 1 2020
 | 
			
		||||
 | 
			
		||||
Úlohy na semester:
 | 
			
		||||
 | 
			
		||||
- Rozbehať anotačnú schému pre vyznačovanie slovenských pomenovaných entít
 | 
			
		||||
- Vybrať a pripraviť vhodné dáta na anotáciu
 | 
			
		||||
- Anotovať sadu dát
 | 
			
		||||
- Natrénovať a vyhodnotiť model
 | 
			
		||||
 | 
			
		||||
 | 
			
		||||
Stretnutie 9.3.2020:
 | 
			
		||||
 | 
			
		||||
Vyvorený prístup do repozitára https://git.kemt.fei.tuke.sk/dano/annotation
 | 
			
		||||
 | 
			
		||||
Úlohy na ďalšie stretnutie:
 | 
			
		||||
 | 
			
		||||
- Oboznámte sa s so [systémom Docker](https://student.kemt.fei.tuke.sk/predmety/zct)
 | 
			
		||||
- Rozbehajte si anotáciu z repozitára
 | 
			
		||||
- Skúste upraviť proces tak aby bol vhodný na anotáciu slovenských pomenovaných entít
 | 
			
		||||
 | 
			
		||||
Návrh možných entít na anotáciu:
 | 
			
		||||
 | 
			
		||||
- OSOBA
 | 
			
		||||
- MIESTO alebo politická geografická entita
 | 
			
		||||
- ORGANIZACIA
 | 
			
		||||
- PRODUKT
 | 
			
		||||
- INE
 | 
			
		||||
 | 
			
		||||
 | 
			
		||||
 | 
			
		||||
 | 
			
		||||
## Tímový projekt 2019
 | 
			
		||||
 | 
			
		||||
#### Anotácia textových dát
 | 
			
		||||
 | 
			
		||||
*Úlohy tímového projektu*:
 | 
			
		||||
 | 
			
		||||
- Vypracujte min. 4. stranový rešerš na tému "Crowdsourcing"
 | 
			
		||||
- citujte min. 10 najvýznamnejších bibliografických zdrojov
 | 
			
		||||
 | 
			
		||||
@ -19,9 +52,11 @@
 | 
			
		||||
4. Natrénujte štatistický model pomocou knižnice Spacy a zistite, aký vplyv má veľkosť trénovacej množiny na presnosť klasifikátora.
 | 
			
		||||
 | 
			
		||||
*Návrh na názov DP*:
 | 
			
		||||
 | 
			
		||||
Anotácia textových dát v slovenskom jazyku pomocou metódy crowdsourcingu
 | 
			
		||||
 | 
			
		||||
*Spolupráca s projektom*:
 | 
			
		||||
 | 
			
		||||
- [Podpora slovenčiny v Spacy](/topics/spacy)
 | 
			
		||||
- [Anotácia textových dát](/topics/prodigy)
 | 
			
		||||
- [Rozpoznávanie pomenovaných entít](/topics/named-entity)
 | 
			
		||||
 | 
			
		||||
@ -1,7 +1,34 @@
 | 
			
		||||
 | 
			
		||||
# Lukáš Pokrývka
 | 
			
		||||
 | 
			
		||||
*Rok začiatku štúdia:* 2016
 | 
			
		||||
 | 
			
		||||
## Diplomový projekt 1 2020
 | 
			
		||||
 | 
			
		||||
Ulohy na semester:
 | 
			
		||||
 | 
			
		||||
- podrobne si naštudovať vybranú metódu trénovania neurónových sietí
 | 
			
		||||
- identifikujte možný spôsob paralelizácie
 | 
			
		||||
- natrénujte zvolený model metódou paralelizácie
 | 
			
		||||
 | 
			
		||||
 | 
			
		||||
Stretnutie 9.3.2020
 | 
			
		||||
 | 
			
		||||
Úlohy na ďalšie stretnutie:
 | 
			
		||||
 | 
			
		||||
- Skúste natrénovať slovenský word2vec model podľa tutoriálu: http://spark.apache.org/docs/latest/ml-features.html#word2vec (podľa dát z emailu)
 | 
			
		||||
- Pozrite si niečo o metóde BERT
 | 
			
		||||
 | 
			
		||||
- https://medium.com/huggingface/introducing-fastbert-a-simple-deep-learning-library-for-bert-models-89ff763ad384
 | 
			
		||||
- https://github.com/huggingface/transformers
 | 
			
		||||
 | 
			
		||||
 | 
			
		||||
 | 
			
		||||
 | 
			
		||||
 | 
			
		||||
 | 
			
		||||
 | 
			
		||||
 | 
			
		||||
## Tímový projekt 2019
 | 
			
		||||
 | 
			
		||||
*Úlohy tímového projektu:*
 | 
			
		||||
@ -12,6 +39,7 @@
 | 
			
		||||
*Písomná práca:* [Paralelné spracovanie prirodzeného jazyka](./timovy_projekt)
 | 
			
		||||
 | 
			
		||||
## Diplomová práca 2021
 | 
			
		||||
 | 
			
		||||
### Paralelné trénovanie neurónových sietí
 | 
			
		||||
 | 
			
		||||
*Meno vedúceho:* Ing. Daniel Hládek, PhD.
 | 
			
		||||
@ -24,4 +52,4 @@
 | 
			
		||||
4. Navrhnite možné zlepšenia paralelného trénovania neurónových sietí.
 | 
			
		||||
 | 
			
		||||
 | 
			
		||||
- Zaujímavá príručka [Word2vec na Spark](http://spark.apache.org/docs/latest/ml-features.html#word2vec)
 | 
			
		||||
- Zaujímavá príručka [Word2vec na Spark](http://spark.apache.org/docs/latest/ml-features.html#word2vec)
 | 
			
		||||
 | 
			
		||||
		Loading…
	
		Reference in New Issue
	
	Block a user