2020-10-01 13:15:25 +00:00
---
title: Oleh Bilykh
published: true
taxonomy:
2020-10-02 14:06:48 +00:00
category: [bp2021]
2021-01-21 15:29:24 +00:00
tag: [question-answer,drqa,qa,demo,nlp]
2020-10-01 13:15:25 +00:00
author: Daniel Hladek
---
2020-09-25 09:32:22 +00:00
# Oleh Bilykh
*Začiatok štúdia: 2018*
2021-01-21 15:44:46 +00:00
Súvisiace stránky:
- [Ongrej Megela ](/students/2018/bilykh ) - RoBERTa
- [Lukáš Pokrývka ](/students/2016/pokryvka ) - paralelné trénovanie
- [Question Answering ](/topics/question ) - interný projekt
- Matej Čarňanský (BERT)
2021-03-19 09:29:54 +00:00
## Bakalárska práca 2021
2020-09-25 09:32:22 +00:00
Téma:
Automatické generovanie odpovedí na otázky v prirodzenom jazyku pomocou neurónových sietí.
Návrh na zadanie BP:
2020-11-13 12:08:00 +00:00
- Vypracujte teoretický prehľad metód automatického generovania odpovede na otázky v prirodzenom jazyku.
2020-10-12 12:21:27 +00:00
- Zvoľte vhodný existujúci systém a pripravte ho na použitie.
2020-11-13 12:08:00 +00:00
- Navrhnite, vykonajte a vyhodnoťte experimenty s generovaním odpovede na otázky v prirodzenom jazyku.
2020-10-12 12:12:20 +00:00
- Navrhnite možné zlepšenia systému pre generovanie odpovede.
2021-03-19 09:29:54 +00:00
Stretnutie 19.3.
Stav:
- Podarilo sa natrénovať SQUAD model pre DrQA.
- Podarilo sa spustiť skript pre vyhodnotenie.
- Webová aplikácia je funkčná.
- Písomná časť je rozporacovaná.
## Bakalársky projekt 2020
2020-10-12 12:21:27 +00:00
Zásobník úloh:
- Nainštalovať a natrénovať systém DrQA s databázou SquAD.
- Natrénujte vlastný model.
- Vyhodnnotte natrénovaný model.
- Pripravte jednoduché demo ako webovú aplikáciu (doplňujúca úloha).
2021-03-19 09:29:54 +00:00
Konzultácie sa budú konakť minimálne raz za dva týždne, menej ako 6 konzultácií za semester je dôvodom pre zníženie hodnotenia alebo neudelenie zápočtu.
2021-02-02 13:50:37 +00:00
Stretnutie 2.2.2021
Stav:
- Nainštalovaný a funkčný systém DrQA na servri tesla - konzola aj web aplikácia.
- Použitý je existujúci model.
- Dorobená prezentácia.
2020-12-17 08:45:44 +00:00
2021-02-02 13:57:51 +00:00
Do ďalšieho stretnutia:
2021-02-02 14:08:44 +00:00
- Pracujte na písomnej časti - prezentujte na ďalšom stretnutí.
2021-02-02 13:57:51 +00:00
- Vytvorte repozitár na GITe a dajte tam návod na inštaláciu DrQA.
2021-02-02 14:08:44 +00:00
- Zistite ako sa robí vyhodnotenie a vyhodnotte existujúci model na databáze SQAD.
- Prejdite si https://github.com/facebookresearch/DrQA/blob/master/scripts/reader/README.md a urobte zápis vykonaných krokov.
2021-02-02 14:12:05 +00:00
- Vytvorte skript pre spustenie webovej aplikácie a pridajte ho na git.
2021-02-02 13:57:51 +00:00
2020-12-17 08:45:44 +00:00
E-mail 17.12.2020:
- Na IDOC nainštalovaný Pytorch 1.0, spustenie ide na GPU, ale nastala chyba
`OSError: [Errno 12] Cannot allocate memory` .
- Vytvorený prístup na tesla, kde sa nachádza viac pamäte.
2020-12-03 12:20:10 +00:00
Stretnutie: 3.12.2020
Stav:
- Riešenie technického problému so spustením, pravdepodobne treba použiť staršiu verziu Pytorch 1.0. Na CPU na idoc to nejde, načíta model ale nevypíše výsledky.
2020-11-20 12:57:33 +00:00
Stretnutie 20.11.2020
Stav:
2020-11-20 13:13:44 +00:00
- Technický problém s inštaláciou: https://github.com/facebookresearch/DrQA
- Vytvorený prístup na idoc
2021-02-02 13:50:37 +00:00
- Práca na písomnej časti.
2020-11-20 13:13:44 +00:00
Úlohy do ďalšieho stretnutia:
- skúsiť nainštalovať DrQA na Linuxe.
- anotovať aspoň 100 otázok podľa: https://zp.kemt.fei.tuke.sk/topics/question/navod
- zapíšte si postup pre úspešnú inštaláciou
- Prebehnite tutoriál DrQA
2020-11-20 13:18:58 +00:00
- Pokračujte v písaní - urobte si poznámky z článku "Reading {Wikipedia} to Answer Open-Domain Questions" o DrQA.
2020-11-20 12:57:33 +00:00
2020-11-13 11:59:43 +00:00
Stretnutie: 13.11.2020
Stav:
2020-11-13 12:08:00 +00:00
- Nainštalovaná Anaconda a Jupyter notebook, nič viac.
Úlohy na ďalšie stretnutie:
- Dobehnúť zameškané.
2020-10-12 12:21:27 +00:00
2020-10-12 12:12:20 +00:00
Stretnutie: 12.10.2020
Úlohy na ďalšie stretnutie:
- Vypracujte poznámky z toho čo ste sa dozvedeli o systémoch pre generovanie odpovedí.
- definujte úlohu
- predstavte existujúce implementácie. Aké metódy využívajú? Uveďte aj odkazy na odborné články.
- predstavte možné trénovacie množiny
2020-10-12 12:21:27 +00:00
- Z literatúry zistite, akým spôsobom sa vyhodnocuje systém pre generovanie odpovedí.
- Vyskúšajte si nainštalovať systém DrQA a vyskúšajte ho s existujúcim modelom.
- odporúčam použiť virtuálne prostredie Python (virtualenv) alebo systém Anaconda.
- Prejdite si tutoriál https://github.com/facebookresearch/DrQA
Stav:
2020-10-12 12:12:20 +00:00
2020-10-12 12:21:27 +00:00
- Oboznámenie sa s úlohou.
2020-09-25 09:32:22 +00:00
Stretnutie 25.9.2020
Úlohy na ďalšie stretnutie:
- Oboznámte sa s https://git.kemt.fei.tuke.sk/KEMT/zpwiki/src/branch/master/pages/topics/question
- čo je SQuaD
- prečítajte si články
- Pozrite si existujúce implementácie, jednu z nich si vyberiete.