Compare commits
3 Commits
9f6c746d7e
...
3f75d311e8
Author | SHA1 | Date | |
---|---|---|---|
3f75d311e8 | |||
68293b2f36 | |||
00f6179838 |
@ -1,12 +1,12 @@
|
||||
---
|
||||
title: Manohar Gowdru
|
||||
title: Manohar Gowdru Shridharu
|
||||
published: true
|
||||
taxonomy:
|
||||
category: [phd2024]
|
||||
tag: [lm,nlp]
|
||||
author: Daniel Hladek
|
||||
---
|
||||
# Manohar Gowdru
|
||||
# Manohar Gowdru Shridharu
|
||||
|
||||
Beginning of the study: 2021
|
||||
|
||||
|
@ -16,6 +16,12 @@ author: Daniel Hládek
|
||||
- diplomová práza Jozef Olekšák (inprogress, trénovanie electra na colab).
|
||||
- https://git.kemt.fei.tuke.sk/dano/bert-train
|
||||
|
||||
## Rozpracované úlohy
|
||||
|
||||
- Trénovanie na TPU Google Colab Electra Base. (Olekšák)
|
||||
- trénovanie XLNet Base
|
||||
- Tokenizer SentencePiece pre XLNet
|
||||
|
||||
|
||||
## Hotové úlohy
|
||||
|
||||
@ -38,15 +44,11 @@ author: Daniel Hládek
|
||||
- Natrénovaný HF Roberta Small
|
||||
- Deduplikovaný webový korpus oscar plus skweb2017
|
||||
- tokenizer BPE Roberta
|
||||
- Trénovanie Roberta Base
|
||||
|
||||
## Budúce úlohy
|
||||
|
||||
- Trénovanie na TPU Google Colab
|
||||
- Natrénovať Electra Base.
|
||||
- Pripraviť aj iné množiny na vyhodnotnie: kategorizácia textu na SCNC1.
|
||||
- Trénovanie Roberta Base
|
||||
- trénovanie XLNet Base
|
||||
- Tokenizer SentencePiece pre XLNet
|
||||
- Pridať Wikipedia do trénovania.
|
||||
|
||||
## Poznámky
|
||||
|
Loading…
Reference in New Issue
Block a user