zpwiki/pages/students/2019/alina_vitko
2022-04-08 11:29:40 +00:00
..
README.md Update 'pages/students/2019/alina_vitko/README.md' 2022-04-08 11:29:40 +00:00

title published taxonomy
Alina Vitko true
category tag author
bp2022
ir
qa
nlp
Daniel Hladek

rok začiatku štúdia: 2019

Bakalárska práca 2022

Systémy pre generovanie odpovede na otázku v prirodzenom jazyku

  1. Vypracujte prehľad aktuálnych metód pre generovanie odpovede na otázku v prirodzenom jazyku.
  2. Vyberte a podrobne opíšte existujúci systém pre generovanie odpovede na otázku v prirodzenom slovenskom jazyku.
  3. Vytvorte demonštračnú webovú aplikáciu pre vybraný systém.
  4. Navrhnite zlepšenia systému pre generovanie odpovede.

Stretnutie 8.4.

Progres zatiaľ nenastal.

Úlohy platia z minulého stretnutia.

Zásobník úloh:

Stretnutie 17.1.2022

  • Zmenené texty v demo aplikácii
  • Pridaná časť do textu práce

Úlohy:

  • Dokončiť demo slovenským modelom podľa minulých úloh.
  • pokračovať v písaní práce.

Stretnutie 28.1.

Úlohy:

  • Naklonujte si repozitár.
  • Získajte slovenský model a dajte ho do adresára models. Zistite, akého typu je slovenský model.
  • Modifikujte demo aplikáciu tak, aby pracovala so slovenským modelom.
  • Modifikujte demo aplikáciu tak aby bola "naša". Preložte ju, doplnte obrázky.
  • Oboznámte sa s knižnicou https://streamlit.io/
  • Do práce pridajte časť, kde podrobne opíšete ako funguje QA s použitím knižnite transformers. Napíšte o modeloch, ktoré budete prezentovať.

Zásobník úloh:

  • Pripravte aplikáciu do podoby vhodnej na nasadenie. Vytvorte Dockerfile.

Bakalársky projekt 2021

Vytovrenie prehľadu existujúcich systémov QA.

Stretnutie 17.12.2021

  • Inštalácia funguje, ale spustenie nefunguje. Možný dôvod je to že to nie je kompatibilné s Windows. Alebo nastala chyba pri inštalácii.

Úlohy:

Stretnutie 10.12.2021

Úlohy:

Vyskúšajte nainštalovať https://github.com/facebookresearch/DrQA do virtuálneho priostredia Anaconda.

Ako nainštalovať https://github.com/fastforwardlabs/question_answering:

Je potrebné mať nekoľko GB voľného miesta. Ak je Váš počítač pomalý, vytvorím Vám konto na školskom servri.

  1. Aktivujte si prázdne prostredie Anaconda.
    conda create -m qa
    conda activate qa
  1. Nainštalujte Pytorch:
    conda install pytorch=1.6 torchvision torchaudio cpuonly -c pytorch
  1. naklonujte repozitár
    git clone https://github.com/fastforwardlabs/question_answering
    cd question_answering
  1. nainštalujte aplikáciu
    pip install -r requirements.txt
  1. Spustite web rozhranie
    streamlit run ./apps/wikiqa.py

Stretnutie 12.11.2021

  • Pokračuje práca na texte
  • Nainštalovaná Anaconda
  • Začiatok Python Tutoriálu

Úlohy:

Zásobník úloh:

Stretnutie 5.11.2021

  • Splnené zadané úlohy z minulého týždňa, okrem nainštalovania

Stretnutie 28.10.2021

Stav:

Vypracovaný prehľad viacerých systémov QA a viacerých datasetov na QA.

Úlohy:

  • Navrhnite niekoľko spôsobov prekladu výrazu question answering systems do slovenčiny.
  • napr. systémy odpovedania na otázku, systémy pre generovanie odpovede na otázku v prirodzenom jazyku.
  • Vyhľadajte tieto termíny na internete.
  • Nainštalujte a vyskúšajte vybraný systém
  • Doplňte odkazy na odborné články do textu práce.

Úlohy:

  • Doplňte odkazy na zdroje, aj do textu.
  • Doplňte teoretický úvod do QA.
  • Dopíšte informácie o datasetoch SQUAD -1.0 a 2.0. a MRQA.
  • Doplňte metodiku vyhodnotenia QA, napr. F1-precision-recall.
  • Vyberte jeden systém QA, skúste ho nainštalovať a vyskúšať tak ako je.

Zásobník úloh:

Stretnutie 15.10.2021

Stav:

  • Začiatok písania prehľadu QA (nie hotový).

Úlohy:

  • Vyberte min. dva odborné články alebo knihy a napíšte čo ste sa z nich dozvedeli o systémoch pre generovanie odpovede na otázku v prirodzenom jazyku, Napíšte bibliografické údaje o zdroji.
  • Webové stránky a blogy môžete tiež používať.
  • Nájdite a opíšte čo najviac QA systémov. Začať môžete systémom DRQA.