Update 'pages/students/2018/adrian_remias/README.md'
This commit is contained in:
parent
b79f78cc8e
commit
eb4f8def32
@ -34,8 +34,37 @@ Stretnutie 7.12.2023
|
|||||||
Stav:
|
Stav:
|
||||||
|
|
||||||
- Vytvorený program na trénovanie neurónovej siete. Masked language modeling skript run_mlm.py. Roberta for Masked LM DataCollatorForLanguageModelling.
|
- Vytvorený program na trénovanie neurónovej siete. Masked language modeling skript run_mlm.py. Roberta for Masked LM DataCollatorForLanguageModelling.
|
||||||
|
- Navrhnutý skript pridáva mask token medzi slová a sleduje, čo doplní model. Časť s trénovaním je v tomto prípade zbytočná.
|
||||||
|
|
||||||
|
Úlohy:
|
||||||
|
|
||||||
|
- Vyhoddnotte prenosť Vami navrhnutého prístupu. Mali by ste zostaviť kontingenčnú tabuľku. (confusion matrix). Tabuľka má na jednej osi očakávané hodnoty a na druhej osi skutočné hodnoty. https://www.analyticsvidhya.com/blog/2020/09/precision-recall-machine-learning/
|
||||||
|
- O spôsobe vyhodnotenia môžete napísať aj krátku podkapitolu.
|
||||||
|
- Uvedte zdroje odkiaľ ste čerpali pri tvorbe.
|
||||||
|
|
||||||
|
```
|
||||||
|
Pôvodný text: Dnes je pekný deň .
|
||||||
|
Opravený text Dnes , je pekný deň .
|
||||||
|
|
||||||
|
. , ? ! x toto dáva sieť
|
||||||
|
. 2 1 0 0 0
|
||||||
|
,
|
||||||
|
?
|
||||||
|
!
|
||||||
|
x 1 1
|
||||||
|
očakávané hodnoty
|
||||||
|
```
|
||||||
|
|
||||||
|
Zásobník úloh:
|
||||||
|
|
||||||
|
- Dotrénujte neurónovú sieť na úlohu dopňlňania interpunkcie. Úloha je formulovaná ako "klasifikácia postupností" a je podobná úlohám "part of speech tagging" alebo "named entity recognition".
|
||||||
|
|
||||||
|
Takto by mala vyzerať trénovacia množina.
|
||||||
|
|
||||||
|
```
|
||||||
|
x x x . , x x .
|
||||||
|
Dnes je pekný den Povedala že ostane doma
|
||||||
|
```
|
||||||
|
|
||||||
Stretnutie 23.11.2023
|
Stretnutie 23.11.2023
|
||||||
|
|
||||||
@ -46,7 +75,7 @@ Stav:
|
|||||||
|
|
||||||
Úlohy:
|
Úlohy:
|
||||||
|
|
||||||
- Podrobne sa oboznámte https://github.com/xashru/punctuation-restoration/tree/master . Prečítajte si
|
- [ ] Podrobne sa oboznámte https://github.com/xashru/punctuation-restoration/tree/master . Prečítajte si
|
||||||
článok. Urobte si poznámky čo ste sa dozvedeli. Zistite, aké metódy iné sa používajú na PR a aká metóda je v článku. Zistitie, ako to súvisí s Modelom BERT.
|
článok. Urobte si poznámky čo ste sa dozvedeli. Zistite, aké metódy iné sa používajú na PR a aká metóda je v článku. Zistitie, ako to súvisí s Modelom BERT.
|
||||||
- Pohľadajte iný podobný repozitár.
|
- Pohľadajte iný podobný repozitár.
|
||||||
- Získajte zdrojové kódy a spustite experimenty v naglickom a bangla jazyku s dátami dodanými v repozitári. Oboznámte sa so zdrojovými kódmi a skúste pochopiť ktorá časť robí čo.
|
- Získajte zdrojové kódy a spustite experimenty v naglickom a bangla jazyku s dátami dodanými v repozitári. Oboznámte sa so zdrojovými kódmi a skúste pochopiť ktorá časť robí čo.
|
||||||
|
Loading…
Reference in New Issue
Block a user