diff --git a/pages/students/2016/maros_harahus/README.md b/pages/students/2016/maros_harahus/README.md index f31f92a669..51b9b6126c 100644 --- a/pages/students/2016/maros_harahus/README.md +++ b/pages/students/2016/maros_harahus/README.md @@ -12,8 +12,6 @@ taxonomy: - [GIT repozitár s poznámkami](https://git.kemt.fei.tuke.sk/mh496vd/Doktorandske) (súkromný) - - ## Dizertačná práca v roku 2023/24 @@ -41,6 +39,53 @@ Ciele: - Pomáhať s výukou, projektami a výskumom. +Plán činosti na semester: + +1. Prediskutovať a vybrať definitívnu tému. Obidve témy sú komplikované. + - Trénovanie jazykových modelov. Cieľom by bolo zlepšenie jazykového modelovania. + - [x] Dá sa nadviazať na existujúce trénovacie skripty. + - [x] Dá sa využiť webový korpus. + - [x] Dá sa využiť naša GPU infraštruktúra. (Na trénovanie menších modelov) + - [x] Veľký praktický prínos. + - [ ] Teoretický prínos je otázny. + - [ ] Naša infraštruktúra je asi slabá na väčšie modely. + - Oprava gramatických chýb. + - [x] Dá sa nadviazať na "spelling correction" výskum a skripty. + - [x] Teoretický prínos je väčší. + - [x] Trénovanie by bolo jednoduchšie na našom HW. + +2. Napísať prehľadový článok. + - Prečítať existujúce prehľady na danú tému. Zistitť ako boli napísané, kde boli uverejnené, čo je ich prínos. Je dobré použiť metodiku https://www.prisma-statement.org// + - Identifikovať v čom by bol náš prehľad originálny a kde by bolo možné uverejniť. + - Prečítať a zotriediť aspoň 200 článkov na danú tému. + - Zistiť, aké metódy, datasety a spôsoby vyhodnotenia sa používajú. + - Rozšíriť prehľadový článok do formy minimovky. + +3. Priebežne pracovať na experimentoch. + - Vybrať vhodnú dátovú množinu a metriku vyhodotenia. + - Vybrať základnú metódu a vyhodnotiť. + - Vyskúšať modifikáciu základnej metódy a vyhodotiť. + +4. Napísať 2 konferenčné články. + - Písať si poznámky pri experimentoch. + - Predbežné experimenty zverejniť v krátkom článku. + - Prediskutovať spôsob financovania. + +Stretnutie 9.9.2022 + +Stav: + +Počas prázdnin sa pracovalo na experimentoch s fairseq - strojový preklad a Spacy trénovanie, štúdium literatúry. + +Úlohy: + +- Prečítať niekoľko prehľadov na tému Grammar Correction, zistiť ako sú napísané a čo je v nich napísané. +- Porozmýšľať nad témou práce. +- Pokračovať v experimenotch fairseq. +- Čítať knihy. + + + ## Prvý ročník PhD štúdia 29.6. @@ -492,8 +537,6 @@ Stretnutie: 20.2.2020: - - ## Tímový projekt 2019 Projektové stránky: