forked from KEMT/zpwiki
		
	zz
This commit is contained in:
		
							parent
							
								
									40d1fb9075
								
							
						
					
					
						commit
						f9104754e6
					
				| @ -1,11 +1,44 @@ | ||||
| # Jakub Maruniak | ||||
| 
 | ||||
| *Rok začiatku štúdia*: 2016 | ||||
| 
 | ||||
| ## Diplomový projekt 1 2020 | ||||
| 
 | ||||
| Úlohy na semester: | ||||
| 
 | ||||
| - Rozbehať anotačnú schému pre vyznačovanie slovenských pomenovaných entít | ||||
| - Vybrať a pripraviť vhodné dáta na anotáciu | ||||
| - Anotovať sadu dát | ||||
| - Natrénovať a vyhodnotiť model | ||||
| 
 | ||||
| 
 | ||||
| Stretnutie 9.3.2020: | ||||
| 
 | ||||
| Vyvorený prístup do repozitára https://git.kemt.fei.tuke.sk/dano/annotation | ||||
| 
 | ||||
| Úlohy na ďalšie stretnutie: | ||||
| 
 | ||||
| - Oboznámte sa s so [systémom Docker](https://student.kemt.fei.tuke.sk/predmety/zct) | ||||
| - Rozbehajte si anotáciu z repozitára | ||||
| - Skúste upraviť proces tak aby bol vhodný na anotáciu slovenských pomenovaných entít | ||||
| 
 | ||||
| Návrh možných entít na anotáciu: | ||||
| 
 | ||||
| - OSOBA | ||||
| - MIESTO alebo politická geografická entita | ||||
| - ORGANIZACIA | ||||
| - PRODUKT | ||||
| - INE | ||||
| 
 | ||||
| 
 | ||||
| 
 | ||||
| 
 | ||||
| ## Tímový projekt 2019 | ||||
| 
 | ||||
| #### Anotácia textových dát | ||||
| 
 | ||||
| *Úlohy tímového projektu*: | ||||
| 
 | ||||
| - Vypracujte min. 4. stranový rešerš na tému "Crowdsourcing" | ||||
| - citujte min. 10 najvýznamnejších bibliografických zdrojov | ||||
| 
 | ||||
| @ -19,9 +52,11 @@ | ||||
| 4. Natrénujte štatistický model pomocou knižnice Spacy a zistite, aký vplyv má veľkosť trénovacej množiny na presnosť klasifikátora. | ||||
| 
 | ||||
| *Návrh na názov DP*: | ||||
| 
 | ||||
| Anotácia textových dát v slovenskom jazyku pomocou metódy crowdsourcingu | ||||
| 
 | ||||
| *Spolupráca s projektom*: | ||||
| 
 | ||||
| - [Podpora slovenčiny v Spacy](/topics/spacy) | ||||
| - [Anotácia textových dát](/topics/prodigy) | ||||
| - [Rozpoznávanie pomenovaných entít](/topics/named-entity) | ||||
|  | ||||
| @ -1,7 +1,34 @@ | ||||
| 
 | ||||
| # Lukáš Pokrývka | ||||
| 
 | ||||
| *Rok začiatku štúdia:* 2016 | ||||
| 
 | ||||
| ## Diplomový projekt 1 2020 | ||||
| 
 | ||||
| Ulohy na semester: | ||||
| 
 | ||||
| - podrobne si naštudovať vybranú metódu trénovania neurónových sietí | ||||
| - identifikujte možný spôsob paralelizácie | ||||
| - natrénujte zvolený model metódou paralelizácie | ||||
| 
 | ||||
| 
 | ||||
| Stretnutie 9.3.2020 | ||||
| 
 | ||||
| Úlohy na ďalšie stretnutie: | ||||
| 
 | ||||
| - Skúste natrénovať slovenský word2vec model podľa tutoriálu: http://spark.apache.org/docs/latest/ml-features.html#word2vec (podľa dát z emailu) | ||||
| - Pozrite si niečo o metóde BERT | ||||
| 
 | ||||
| - https://medium.com/huggingface/introducing-fastbert-a-simple-deep-learning-library-for-bert-models-89ff763ad384 | ||||
| - https://github.com/huggingface/transformers | ||||
| 
 | ||||
| 
 | ||||
| 
 | ||||
| 
 | ||||
| 
 | ||||
| 
 | ||||
| 
 | ||||
| 
 | ||||
| ## Tímový projekt 2019 | ||||
| 
 | ||||
| *Úlohy tímového projektu:* | ||||
| @ -12,6 +39,7 @@ | ||||
| *Písomná práca:* [Paralelné spracovanie prirodzeného jazyka](./timovy_projekt) | ||||
| 
 | ||||
| ## Diplomová práca 2021 | ||||
| 
 | ||||
| ### Paralelné trénovanie neurónových sietí | ||||
| 
 | ||||
| *Meno vedúceho:* Ing. Daniel Hládek, PhD. | ||||
| @ -24,4 +52,4 @@ | ||||
| 4. Navrhnite možné zlepšenia paralelného trénovania neurónových sietí. | ||||
| 
 | ||||
| 
 | ||||
| - Zaujímavá príručka [Word2vec na Spark](http://spark.apache.org/docs/latest/ml-features.html#word2vec) | ||||
| - Zaujímavá príručka [Word2vec na Spark](http://spark.apache.org/docs/latest/ml-features.html#word2vec) | ||||
|  | ||||
		Loading…
	
		Reference in New Issue
	
	Block a user