forked from KEMT/zpwiki
34 lines
805 B
Markdown
34 lines
805 B
Markdown
# Tomáš Kuchárik
|
|
## Diplomový projekt 1
|
|
|
|
Úlohy na semester:
|
|
|
|
- Získať a parsovať dump slovenskej wikipédie z https://dumps.wikimedia.org/mirrors.html
|
|
- Vybrať prvú množinu článkov
|
|
- Nasadiť anotačnú aplikáciu - tvorbu otázky a vyznačenie odpovede.
|
|
- Možno: natrénovať model z anglických alebo slovenských dát.
|
|
|
|
|
|
Úvodné stretnutie 6.3.2020.
|
|
|
|
Porozmýšľať:
|
|
|
|
- Ako vyberieme najlepšie články (PageRank?)
|
|
-
|
|
|
|
Úlohy pre vedúceho:
|
|
|
|
- Vytvoriť spoločný repozitár Prodigy
|
|
- Vytvoriť Wiki stránku pre projekt
|
|
|
|
|
|
|
|
|
|
## Diplomová práca 2021
|
|
|
|
Vytváranie komplexných korpusov pre aplikácie porozumenia prirodzeného jazyka
|
|
|
|
Cieľom práce je príprava nástrojov a budovanie tzv. "Question Answering datasetov"
|
|
|
|
Anotácia pomocou systému [Prodigy](https://prodi.gy/docs)
|