zz
This commit is contained in:
parent
00f6179838
commit
68293b2f36
@ -16,6 +16,12 @@ author: Daniel Hládek
|
|||||||
- diplomová práza Jozef Olekšák (inprogress, trénovanie electra na colab).
|
- diplomová práza Jozef Olekšák (inprogress, trénovanie electra na colab).
|
||||||
- https://git.kemt.fei.tuke.sk/dano/bert-train
|
- https://git.kemt.fei.tuke.sk/dano/bert-train
|
||||||
|
|
||||||
|
## Rozpracované úlohy
|
||||||
|
|
||||||
|
- Trénovanie na TPU Google Colab Electra Base. (Olekšák)
|
||||||
|
- trénovanie XLNet Base
|
||||||
|
- Tokenizer SentencePiece pre XLNet
|
||||||
|
|
||||||
|
|
||||||
## Hotové úlohy
|
## Hotové úlohy
|
||||||
|
|
||||||
@ -38,15 +44,11 @@ author: Daniel Hládek
|
|||||||
- Natrénovaný HF Roberta Small
|
- Natrénovaný HF Roberta Small
|
||||||
- Deduplikovaný webový korpus oscar plus skweb2017
|
- Deduplikovaný webový korpus oscar plus skweb2017
|
||||||
- tokenizer BPE Roberta
|
- tokenizer BPE Roberta
|
||||||
|
- Trénovanie Roberta Base
|
||||||
|
|
||||||
## Budúce úlohy
|
## Budúce úlohy
|
||||||
|
|
||||||
- Trénovanie na TPU Google Colab
|
|
||||||
- Natrénovať Electra Base.
|
|
||||||
- Pripraviť aj iné množiny na vyhodnotnie: kategorizácia textu na SCNC1.
|
- Pripraviť aj iné množiny na vyhodnotnie: kategorizácia textu na SCNC1.
|
||||||
- Trénovanie Roberta Base
|
|
||||||
- trénovanie XLNet Base
|
|
||||||
- Tokenizer SentencePiece pre XLNet
|
|
||||||
- Pridať Wikipedia do trénovania.
|
- Pridať Wikipedia do trénovania.
|
||||||
|
|
||||||
## Poznámky
|
## Poznámky
|
||||||
|
Loading…
Reference in New Issue
Block a user