forked from KEMT/zpwiki
		
	
		
			
				
	
	
		
			85 lines
		
	
	
		
			2.5 KiB
		
	
	
	
		
			Markdown
		
	
	
	
	
	
			
		
		
	
	
			85 lines
		
	
	
		
			2.5 KiB
		
	
	
	
		
			Markdown
		
	
	
	
	
	
---
 | 
						|
title: Stanislav Matsunych
 | 
						|
published: true
 | 
						|
taxonomy:
 | 
						|
    category: [bp2020]
 | 
						|
    tag: [nn,lm,nlp]
 | 
						|
    author: Daniel Hladek
 | 
						|
---
 | 
						|
# Stanislav Matsunych
 | 
						|
 | 
						|
## Bakalárska práca 2019
 | 
						|
 | 
						|
Generovanie a modelovanie prirodzeného jazyka pomocou rekurentných neurónových sietí
 | 
						|
 | 
						|
- [Zdrojové texty BP](https://git.kemt.fei.tuke.sk/sm892rt/BC_Matsunych_2020_Final)
 | 
						|
- [CRZP](https://opac.crzp.sk/?fn=detailBiblioForm&sid=60B4917E3BAC23F10C7DAB27651C&seo=CRZP-detail-kniha)
 | 
						|
 | 
						|
### Návrh na zadanie
 | 
						|
 | 
						|
1. Vypracovať prehľad metód generovania prirodzeného jazyka pomocou rekurentných neurónových sietí
 | 
						|
2. Vyberte si vhodnú metódu na zostavenie modelu prirodzeného jazyka a natrénujte model na vhodných dátach.
 | 
						|
3. Vytvorte aplikáciu, ktorá bude demonštrovať generovanie prirodzeného jazyka
 | 
						|
4. Vyhodnotte vytvorený model a navrhnite jeho zlepšenia.
 | 
						|
 | 
						|
 | 
						|
## Stretnutia
 | 
						|
 | 
						|
Revízia 14.5.:
 | 
						|
 | 
						|
- obhajoba v septembri
 | 
						|
 | 
						|
19.2.2020: 
 | 
						|
 | 
						|
- Naštudovať perpelxitu, porozmýšľať ako to implementovať, perplexita= cross entropis
 | 
						|
- začať pracovať na teoretickej časti (vytvárať finálnu podobu).
 | 
						|
 | 
						|
 | 
						|
## Bakalársky projekt 2019
 | 
						|
 | 
						|
Pozrieť si  
 | 
						|
 | 
						|
- https://medium.com/@shivambansal36/language-modelling-text-generation-using-lstms-deep-learning-for-nlp-ed36b224b275
 | 
						|
- https://towardsdatascience.com/character-level-language-model-1439f5dd87fe
 | 
						|
 | 
						|
Prejsť si tutoriál 
 | 
						|
 | 
						|
- http://karpathy.github.io/2015/05/21/rnn-effectiveness/
 | 
						|
- https://machinelearningmastery.com/develop-character-based-neural-language-model-keras/
 | 
						|
 | 
						|
Cielom je: 
 | 
						|
 | 
						|
Vytvoriť jazykový model slovenského jazyka na báze rekurentných neurónových sietí
 | 
						|
 | 
						|
- V prvom semestri bude výstup:
 | 
						|
- jednoduchý program na vytvorenie LM a generovanie znakov z neho
 | 
						|
 | 
						|
- Vypracujte rešerš na tému "Rekurentné neurónové siete na tvorbu jazykových modelov " (LSTM, GRU) cca 10 strán
 | 
						|
 | 
						|
Možné trénovacie texty: [Zlatý fond sme](https://zlatyfond.sme.sk/)
 | 
						|
 | 
						|
Možný framework pre web demo: [Flask](https://www.fullstackpython.com/flask.html)
 | 
						|
 | 
						|
Tutoriál https://realpython.com/flask-by-example-part-1-project-setup/
 | 
						|
 | 
						|
 | 
						|
      502  mkdir flask
 | 
						|
      503  ls -l
 | 
						|
      504  cd flask/
 | 
						|
      505  ls -l
 | 
						|
      506  python -m virtualenv
 | 
						|
      507  python -m virtualenv ./venv
 | 
						|
      508  ls -l
 | 
						|
      509  source ./venv/bin/activate
 | 
						|
      510  ls -l
 | 
						|
      511  pip install flask
 | 
						|
      512  ls -l
 | 
						|
      513  ls -l ./venv/lib/python3.8/site-packages/
 | 
						|
      514  python
 | 
						|
      515  pip install ipython
 | 
						|
      516  ipython
 | 
						|
      517  ls -l
 | 
						|
      518  vim ./mojawebka.py
 | 
						|
      519  history
 | 
						|
 |