This commit is contained in:
Daniel Hládek 2022-02-18 09:07:48 +01:00
commit c05d698c66
5 changed files with 55 additions and 5 deletions

View File

@ -1,4 +1,6 @@
pip install --upgrade pip onmt_build_vocab -config dp2022/sk-en/trainsk.yaml -n_sample 10000
pip install OpenNMT-py
pip install -r requirements.opt.txt onmt_train -config dp2022/sk-en/trainsk.yaml
onmt_translate -model dp2022/sk-en/run/model_step_1000.pt -src dp2022/sk-en/src-test.txt -output dp2022/sk-en/pred_1000.txt -verbose

View File

@ -22,9 +22,12 @@ data:
src_vocab: dp2022/run2/example.vocab.src src_vocab: dp2022/run2/example.vocab.src
tgt_vocab: dp2022/run2/example.vocab.tgt tgt_vocab: dp2022/run2/example.vocab.tgt
# Train on a single GPU
world_size: 1
gpu_ranks: [0]
# Where to save the checkpoints # Where to save the checkpoints
save_model: dp2022/run2/model save_model: dp2022/run2/model
save_checkpoint_steps: 1000 save_checkpoint_steps: 1000
train_steps: 20000 train_steps: 20000
valid_steps: 10000 valid_steps: 10000

View File

@ -19,6 +19,16 @@ Systémy pre generovanie odpovede na otázku v prirodzenom jazyku
3. Vytvorte demonštračnú webovú aplikáciu pre vybraný systém. 3. Vytvorte demonštračnú webovú aplikáciu pre vybraný systém.
4. Navrhnite zlepšenia systému pre generovanie odpovede. 4. Navrhnite zlepšenia systému pre generovanie odpovede.
Stretnutie 17.1.2022
- Zmenené texty v demo aplikácii
- Pridaná časť do textu práce
Úlohy:
- Dokončiť demo slovenským modelom podľa minulých úloh.
- pokračovať v písaní práce.
Stretnutie 28.1. Stretnutie 28.1.
- Demo aplikácia funguje - vieme ju spustit aj nainstalovat. - Demo aplikácia funguje - vieme ju spustit aj nainstalovat.

View File

@ -31,6 +31,18 @@ Ciele:
- Vytvoriť nasadenie distribuovanej databázy na testovaci K8S klaster. - Vytvoriť nasadenie distribuovanej databázy na testovaci K8S klaster.
- Implementovať algoritmus pre zoradenie (ranking) dokumentov v takejto databáze. - Implementovať algoritmus pre zoradenie (ranking) dokumentov v takejto databáze.
15.2.2022
- Kubernetes beží na virtualkach. Potreba nainštalovať ešte k8ssandru, dnes
14.2.2022
- Vytvorené ďalšie 4 virtualky na UVT
10.2.2022
- Vytvorená Virtualka na UVT
Stretnutie 18.10.2021 Stretnutie 18.10.2021
- Nahodený dashboard - Nahodený dashboard
- Vygenerovaný token - Vygenerovaný token

View File

@ -19,8 +19,32 @@ Ciele bakalárskej práce:
- Zlepšiť presnosť modelu Spacy pre slovenčinu - Zlepšiť presnosť modelu Spacy pre slovenčinu
Zadanie:
1. Zistite ako pracuje knižnica Spacy a opíšte metódy ktoré používa.
2. Natrénujte model pre spracovanie slovenského prirodzeného jazyka.
3. Vykonajte viacero experimentov a zistite presnosť pri rôznych parametroch.
4. Identifikujte slabé miesta a zlepšite presnosť spracovania.
## Bakalársky projekt 2021 ## Bakalársky projekt 2021
7.2.2022
- Rozbehaný trénovací skript na vlastnom počítači
- Spustených niekoľko experimentov.
Úlohy:
- Pokračujte v otvorených úlohách.
- Výsledky experimentov dajte do tabuľky do práce.
Zásobník úloh:
- Skúste použiť logovací nástroj https://docs.wandb.ai/guides/integrations/spacy
- Skúste rozbehať trénovacie skripty na školskom servri. Problémy vytriešime na konzultácii.
26.11. 2021 26.11. 2021
- Absolvovaný kurz Explosion https://course.spacy.io/en/ - Absolvovaný kurz Explosion https://course.spacy.io/en/
@ -35,7 +59,6 @@ Ciele bakalárskej práce:
- Vytvorené modely je potrebné vyhodnotiť. Pozrite ako to je v mojom Spacy repozitári. - Vytvorené modely je potrebné vyhodnotiť. Pozrite ako to je v mojom Spacy repozitári.
Zápis 21.10. Zápis 21.10.
Vyskúšať toto: Vyskúšať toto: