This commit is contained in:
Daniel Hládek 2022-02-18 09:07:48 +01:00
commit c05d698c66
5 changed files with 55 additions and 5 deletions

View File

@ -1,4 +1,6 @@
pip install --upgrade pip
pip install OpenNMT-py
pip install -r requirements.opt.txt
onmt_build_vocab -config dp2022/sk-en/trainsk.yaml -n_sample 10000
onmt_train -config dp2022/sk-en/trainsk.yaml
onmt_translate -model dp2022/sk-en/run/model_step_1000.pt -src dp2022/sk-en/src-test.txt -output dp2022/sk-en/pred_1000.txt -verbose

View File

@ -22,9 +22,12 @@ data:
src_vocab: dp2022/run2/example.vocab.src
tgt_vocab: dp2022/run2/example.vocab.tgt
# Train on a single GPU
world_size: 1
gpu_ranks: [0]
# Where to save the checkpoints
save_model: dp2022/run2/model
save_checkpoint_steps: 1000
train_steps: 20000
valid_steps: 10000

View File

@ -19,6 +19,16 @@ Systémy pre generovanie odpovede na otázku v prirodzenom jazyku
3. Vytvorte demonštračnú webovú aplikáciu pre vybraný systém.
4. Navrhnite zlepšenia systému pre generovanie odpovede.
Stretnutie 17.1.2022
- Zmenené texty v demo aplikácii
- Pridaná časť do textu práce
Úlohy:
- Dokončiť demo slovenským modelom podľa minulých úloh.
- pokračovať v písaní práce.
Stretnutie 28.1.
- Demo aplikácia funguje - vieme ju spustit aj nainstalovat.

View File

@ -31,6 +31,18 @@ Ciele:
- Vytvoriť nasadenie distribuovanej databázy na testovaci K8S klaster.
- Implementovať algoritmus pre zoradenie (ranking) dokumentov v takejto databáze.
15.2.2022
- Kubernetes beží na virtualkach. Potreba nainštalovať ešte k8ssandru, dnes
14.2.2022
- Vytvorené ďalšie 4 virtualky na UVT
10.2.2022
- Vytvorená Virtualka na UVT
Stretnutie 18.10.2021
- Nahodený dashboard
- Vygenerovaný token

View File

@ -19,8 +19,32 @@ Ciele bakalárskej práce:
- Zlepšiť presnosť modelu Spacy pre slovenčinu
Zadanie:
1. Zistite ako pracuje knižnica Spacy a opíšte metódy ktoré používa.
2. Natrénujte model pre spracovanie slovenského prirodzeného jazyka.
3. Vykonajte viacero experimentov a zistite presnosť pri rôznych parametroch.
4. Identifikujte slabé miesta a zlepšite presnosť spracovania.
## Bakalársky projekt 2021
7.2.2022
- Rozbehaný trénovací skript na vlastnom počítači
- Spustených niekoľko experimentov.
Úlohy:
- Pokračujte v otvorených úlohách.
- Výsledky experimentov dajte do tabuľky do práce.
Zásobník úloh:
- Skúste použiť logovací nástroj https://docs.wandb.ai/guides/integrations/spacy
- Skúste rozbehať trénovacie skripty na školskom servri. Problémy vytriešime na konzultácii.
26.11. 2021
- Absolvovaný kurz Explosion https://course.spacy.io/en/
@ -35,7 +59,6 @@ Ciele bakalárskej práce:
- Vytvorené modely je potrebné vyhodnotiť. Pozrite ako to je v mojom Spacy repozitári.
Zápis 21.10.
Vyskúšať toto: