forked from KEMT/zpwiki
		
	Update 'pages/students/2016/maros_harahus/README.md'
This commit is contained in:
		
							parent
							
								
									20fe1b96a2
								
							
						
					
					
						commit
						bc91f11049
					
				@ -12,8 +12,6 @@ taxonomy:
 | 
			
		||||
- [GIT repozitár s poznámkami](https://git.kemt.fei.tuke.sk/mh496vd/Doktorandske) (súkromný)
 | 
			
		||||
 | 
			
		||||
 | 
			
		||||
 | 
			
		||||
 | 
			
		||||
## Dizertačná práca
 | 
			
		||||
 | 
			
		||||
v roku 2023/24
 | 
			
		||||
@ -41,6 +39,53 @@ Ciele:
 | 
			
		||||
- Pomáhať s výukou, projektami a výskumom.
 | 
			
		||||
 | 
			
		||||
 | 
			
		||||
Plán činosti na semester:
 | 
			
		||||
 | 
			
		||||
1. Prediskutovať a vybrať definitívnu tému. Obidve témy sú komplikované.
 | 
			
		||||
    - Trénovanie jazykových modelov. Cieľom by bolo zlepšenie jazykového modelovania. 
 | 
			
		||||
        - [x] Dá sa nadviazať na existujúce trénovacie skripty. 
 | 
			
		||||
        - [x] Dá sa využiť webový korpus.
 | 
			
		||||
        - [x] Dá sa využiť naša GPU infraštruktúra. (Na trénovanie menších modelov)
 | 
			
		||||
        - [x] Veľký praktický prínos.
 | 
			
		||||
        - [ ] Teoretický prínos je otázny.
 | 
			
		||||
        - [ ] Naša infraštruktúra je asi slabá na väčšie modely.
 | 
			
		||||
    - Oprava gramatických chýb.
 | 
			
		||||
        - [x] Dá sa nadviazať na "spelling correction" výskum a skripty.
 | 
			
		||||
        - [x] Teoretický prínos je väčší.
 | 
			
		||||
        - [x] Trénovanie by bolo jednoduchšie na našom HW.
 | 
			
		||||
 | 
			
		||||
2. Napísať prehľadový článok. 
 | 
			
		||||
    - Prečítať existujúce prehľady na danú tému. Zistitť ako boli napísané, kde boli uverejnené, čo je ich prínos. Je dobré použiť metodiku  https://www.prisma-statement.org//
 | 
			
		||||
    - Identifikovať v čom by bol náš prehľad originálny a kde by bolo možné uverejniť.
 | 
			
		||||
    - Prečítať a zotriediť aspoň 200 článkov na danú tému.
 | 
			
		||||
    - Zistiť, aké metódy, datasety a spôsoby vyhodnotenia sa používajú.     
 | 
			
		||||
    - Rozšíriť prehľadový článok do formy minimovky.
 | 
			
		||||
 | 
			
		||||
3. Priebežne pracovať na experimentoch.
 | 
			
		||||
    - Vybrať vhodnú dátovú množinu a metriku vyhodotenia.
 | 
			
		||||
    - Vybrať základnú metódu a vyhodnotiť.
 | 
			
		||||
    - Vyskúšať modifikáciu základnej metódy a vyhodotiť.
 | 
			
		||||
 | 
			
		||||
4. Napísať 2 konferenčné články.
 | 
			
		||||
    - Písať si poznámky pri experimentoch.
 | 
			
		||||
    - Predbežné experimenty zverejniť v krátkom článku.
 | 
			
		||||
    - Prediskutovať spôsob financovania.
 | 
			
		||||
 | 
			
		||||
Stretnutie 9.9.2022
 | 
			
		||||
 | 
			
		||||
Stav:
 | 
			
		||||
 | 
			
		||||
Počas prázdnin sa pracovalo na experimentoch s fairseq - strojový preklad a Spacy trénovanie, štúdium literatúry.
 | 
			
		||||
 | 
			
		||||
Úlohy:
 | 
			
		||||
 | 
			
		||||
- Prečítať niekoľko prehľadov na tému Grammar Correction, zistiť ako sú napísané a čo je v nich napísané.
 | 
			
		||||
- Porozmýšľať nad témou práce.
 | 
			
		||||
- Pokračovať v experimenotch fairseq.
 | 
			
		||||
- Čítať knihy.
 | 
			
		||||
 | 
			
		||||
 | 
			
		||||
 | 
			
		||||
## Prvý ročník PhD štúdia
 | 
			
		||||
 | 
			
		||||
29.6.
 | 
			
		||||
@ -492,8 +537,6 @@ Stretnutie: 20.2.2020:
 | 
			
		||||
 | 
			
		||||
 | 
			
		||||
 | 
			
		||||
 | 
			
		||||
 | 
			
		||||
## Tímový projekt 2019
 | 
			
		||||
 | 
			
		||||
Projektové stránky:
 | 
			
		||||
 | 
			
		||||
		Loading…
	
		Reference in New Issue
	
	Block a user