103 lines
3.1 KiB
Markdown
103 lines
3.1 KiB
Markdown
---
|
|
title: Oleh Bilykh
|
|
published: true
|
|
taxonomy:
|
|
category: [bp2021]
|
|
tag: [qa,demo,nlp]
|
|
author: Daniel Hladek
|
|
---
|
|
# Oleh Bilykh
|
|
|
|
*Začiatok štúdia: 2018*
|
|
|
|
## Bakalársky projekt 2020
|
|
|
|
Konzultácie sa budú konakť minimálne raz za dva týždne, menej ako 6 konzultácií za semester je dôvodom pre zníženie hodnotenia alebo neudelenie zápočtu.
|
|
|
|
Téma:
|
|
|
|
Automatické generovanie odpovedí na otázky v prirodzenom jazyku pomocou neurónových sietí.
|
|
|
|
Návrh na zadanie BP:
|
|
|
|
- Vypracujte teoretický prehľad metód automatického generovania odpovede na otázky v prirodzenom jazyku.
|
|
- Zvoľte vhodný existujúci systém a pripravte ho na použitie.
|
|
- Navrhnite, vykonajte a vyhodnoťte experimenty s generovaním odpovede na otázky v prirodzenom jazyku.
|
|
- Navrhnite možné zlepšenia systému pre generovanie odpovede.
|
|
|
|
Zásobník úloh:
|
|
|
|
- Nainštalovať a natrénovať systém DrQA s databázou SquAD.
|
|
- Natrénujte vlastný model.
|
|
- Vyhodnnotte natrénovaný model.
|
|
- Pripravte jednoduché demo ako webovú aplikáciu (doplňujúca úloha).
|
|
|
|
|
|
E-mail 17.12.2020:
|
|
|
|
- Na IDOC nainštalovaný Pytorch 1.0, spustenie ide na GPU, ale nastala chyba
|
|
`OSError: [Errno 12] Cannot allocate memory`.
|
|
- Vytvorený prístup na tesla, kde sa nachádza viac pamäte.
|
|
|
|
|
|
|
|
|
|
|
|
Stretnutie: 3.12.2020
|
|
|
|
Stav:
|
|
|
|
- Riešenie technického problému so spustením, pravdepodobne treba použiť staršiu verziu Pytorch 1.0. Na CPU na idoc to nejde, načíta model ale nevypíše výsledky.
|
|
|
|
Stretnutie 20.11.2020
|
|
|
|
Stav:
|
|
|
|
- Technický problém s inštaláciou: https://github.com/facebookresearch/DrQA
|
|
- Vytvorený prístup na idoc
|
|
- Práca na písomenj časti.
|
|
|
|
Úlohy do ďalšieho stretnutia:
|
|
|
|
- skúsiť nainštalovať DrQA na Linuxe.
|
|
- anotovať aspoň 100 otázok podľa: https://zp.kemt.fei.tuke.sk/topics/question/navod
|
|
- zapíšte si postup pre úspešnú inštaláciou
|
|
- Prebehnite tutoriál DrQA
|
|
- Pokračujte v písaní - urobte si poznámky z článku "Reading {Wikipedia} to Answer Open-Domain Questions" o DrQA.
|
|
|
|
Stretnutie: 13.11.2020
|
|
|
|
Stav:
|
|
|
|
- Nainštalovaná Anaconda a Jupyter notebook, nič viac.
|
|
|
|
Úlohy na ďalšie stretnutie:
|
|
|
|
- Dobehnúť zameškané.
|
|
|
|
Stretnutie: 12.10.2020
|
|
|
|
Úlohy na ďalšie stretnutie:
|
|
|
|
- Vypracujte poznámky z toho čo ste sa dozvedeli o systémoch pre generovanie odpovedí.
|
|
- definujte úlohu
|
|
- predstavte existujúce implementácie. Aké metódy využívajú? Uveďte aj odkazy na odborné články.
|
|
- predstavte možné trénovacie množiny
|
|
- Z literatúry zistite, akým spôsobom sa vyhodnocuje systém pre generovanie odpovedí.
|
|
- Vyskúšajte si nainštalovať systém DrQA a vyskúšajte ho s existujúcim modelom.
|
|
- odporúčam použiť virtuálne prostredie Python (virtualenv) alebo systém Anaconda.
|
|
- Prejdite si tutoriál https://github.com/facebookresearch/DrQA
|
|
|
|
Stav:
|
|
|
|
- Oboznámenie sa s úlohou.
|
|
|
|
Stretnutie 25.9.2020
|
|
|
|
Úlohy na ďalšie stretnutie:
|
|
|
|
- Oboznámte sa s https://git.kemt.fei.tuke.sk/KEMT/zpwiki/src/branch/master/pages/topics/question
|
|
- čo je SQuaD
|
|
- prečítajte si články
|
|
- Pozrite si existujúce implementácie, jednu z nich si vyberiete.
|