Update 'pages/students/2018/adrian_remias/README.md'
This commit is contained in:
parent
b79f78cc8e
commit
eb4f8def32
@ -34,8 +34,37 @@ Stretnutie 7.12.2023
|
||||
Stav:
|
||||
|
||||
- Vytvorený program na trénovanie neurónovej siete. Masked language modeling skript run_mlm.py. Roberta for Masked LM DataCollatorForLanguageModelling.
|
||||
- Navrhnutý skript pridáva mask token medzi slová a sleduje, čo doplní model. Časť s trénovaním je v tomto prípade zbytočná.
|
||||
|
||||
Úlohy:
|
||||
|
||||
- Vyhoddnotte prenosť Vami navrhnutého prístupu. Mali by ste zostaviť kontingenčnú tabuľku. (confusion matrix). Tabuľka má na jednej osi očakávané hodnoty a na druhej osi skutočné hodnoty. https://www.analyticsvidhya.com/blog/2020/09/precision-recall-machine-learning/
|
||||
- O spôsobe vyhodnotenia môžete napísať aj krátku podkapitolu.
|
||||
- Uvedte zdroje odkiaľ ste čerpali pri tvorbe.
|
||||
|
||||
```
|
||||
Pôvodný text: Dnes je pekný deň .
|
||||
Opravený text Dnes , je pekný deň .
|
||||
|
||||
. , ? ! x toto dáva sieť
|
||||
. 2 1 0 0 0
|
||||
,
|
||||
?
|
||||
!
|
||||
x 1 1
|
||||
očakávané hodnoty
|
||||
```
|
||||
|
||||
Zásobník úloh:
|
||||
|
||||
- Dotrénujte neurónovú sieť na úlohu dopňlňania interpunkcie. Úloha je formulovaná ako "klasifikácia postupností" a je podobná úlohám "part of speech tagging" alebo "named entity recognition".
|
||||
|
||||
Takto by mala vyzerať trénovacia množina.
|
||||
|
||||
```
|
||||
x x x . , x x .
|
||||
Dnes je pekný den Povedala že ostane doma
|
||||
```
|
||||
|
||||
Stretnutie 23.11.2023
|
||||
|
||||
@ -46,7 +75,7 @@ Stav:
|
||||
|
||||
Úlohy:
|
||||
|
||||
- Podrobne sa oboznámte https://github.com/xashru/punctuation-restoration/tree/master . Prečítajte si
|
||||
- [ ] Podrobne sa oboznámte https://github.com/xashru/punctuation-restoration/tree/master . Prečítajte si
|
||||
článok. Urobte si poznámky čo ste sa dozvedeli. Zistite, aké metódy iné sa používajú na PR a aká metóda je v článku. Zistitie, ako to súvisí s Modelom BERT.
|
||||
- Pohľadajte iný podobný repozitár.
|
||||
- Získajte zdrojové kódy a spustite experimenty v naglickom a bangla jazyku s dátami dodanými v repozitári. Oboznámte sa so zdrojovými kódmi a skúste pochopiť ktorá časť robí čo.
|
||||
|
Loading…
Reference in New Issue
Block a user