forked from KEMT/zpwiki
Update 'pages/students/2016/dominik_nagy/README.md'
This commit is contained in:
parent
9d961f88ef
commit
21b9c8ddc8
@ -23,6 +23,28 @@ taxonomy:
|
|||||||
3. Vyberte minimálne dva rôzne modely a porovnajte ich presnosť na vhodnej dátovej množine.
|
3. Vyberte minimálne dva rôzne modely a porovnajte ich presnosť na vhodnej dátovej množine.
|
||||||
4. Na základe výsledkov experimentov navrhnite zlepšenia.
|
4. Na základe výsledkov experimentov navrhnite zlepšenia.
|
||||||
|
|
||||||
|
|
||||||
|
Stretnutie 17.12.2021
|
||||||
|
|
||||||
|
Stav:
|
||||||
|
|
||||||
|
- rozbehané trénovanie na slovensko-anglickom (LinDat) paralelnom korpuse.
|
||||||
|
- model z angličtiny do slovenčiny.
|
||||||
|
- tokenizácia subword NMT.
|
||||||
|
- rozbehané trénovanie na GPU, bez anaconda.
|
||||||
|
|
||||||
|
Úlohy:
|
||||||
|
|
||||||
|
- Cieľ je aby Vaše experimenty boli zopakovateľné. Pridajte všetky trénovacie skripty do git repozitára. Nepridávajte dáta. Pridajte skripty alebo návody na to ako pripraviť dáta.
|
||||||
|
- Zostavte tabuľku kde zapíšete parametre trénovania a dosiahnuté výsledky.
|
||||||
|
- Napíšte prehľad aktuálnych metód strojového prekladu pomocou neurónových sietí kde prečítate viacero vedeckých článkov a ku každému uvediete názov a čo ste sa z neho dozvedeli. Vyhľadávajte kľúčové slovíčka: "Survey of neural machine translation". Chceme sa dozvedieť aj o transformeroch a neurónových jazykových modeloch.
|
||||||
|
- vyskúšajte trénovanie aj s inými architektúrami. Ku každému trénovaniu si poznačte skrupt, výsledky a dajte to na git.
|
||||||
|
|
||||||
|
Zásobník úloh:
|
||||||
|
|
||||||
|
- Výskúšajte preklad v opačnom smere.
|
||||||
|
- Vyskúšanie inej metódy tokenizácie (BPE, sentencepiece, wordpiece - huggingface tokenizers).
|
||||||
|
|
||||||
Stretnutie 6.7.2021
|
Stretnutie 6.7.2021
|
||||||
|
|
||||||
Stav:
|
Stav:
|
||||||
@ -31,7 +53,7 @@ Stav:
|
|||||||
|
|
||||||
Úlohy:
|
Úlohy:
|
||||||
|
|
||||||
- Pokračujte v trénovaní na servri IDOC, použite sakrupt na príápravu prostredia ktorý som Vám dal.
|
- Pokračujte v trénovaní na servri IDOC, použite skript na príápravu prostredia ktorý som Vám dal.
|
||||||
- Pripravte veľký slovensko-anglický paralelný korpus a natrénujte z neho model.
|
- Pripravte veľký slovensko-anglický paralelný korpus a natrénujte z neho model.
|
||||||
- Model vyhodnotťe pomocou metriky BLEU. Naštudujte si metriku BLEU.
|
- Model vyhodnotťe pomocou metriky BLEU. Naštudujte si metriku BLEU.
|
||||||
|
|
||||||
|
Loading…
Reference in New Issue
Block a user