forked from KEMT/zpwiki
805 B
805 B
Tomáš Kuchárik
Diplomový projekt 1
Úlohy na semester:
- Získať a parsovať dump slovenskej wikipédie z https://dumps.wikimedia.org/mirrors.html
- Vybrať prvú množinu článkov
- Nasadiť anotačnú aplikáciu - tvorbu otázky a vyznačenie odpovede.
- Možno: natrénovať model z anglických alebo slovenských dát.
Úvodné stretnutie 6.3.2020.
Porozmýšľať:
- Ako vyberieme najlepšie články (PageRank?)
Úlohy pre vedúceho:
- Vytvoriť spoločný repozitár Prodigy
- Vytvoriť Wiki stránku pre projekt
Diplomová práca 2021
Vytváranie komplexných korpusov pre aplikácie porozumenia prirodzeného jazyka
Cieľom práce je príprava nástrojov a budovanie tzv. "Question Answering datasetov"
Anotácia pomocou systému Prodigy