From 8ab854165c2983309cf6d03c12d157052de98404 Mon Sep 17 00:00:00 2001 From: dano Date: Fri, 6 Mar 2020 08:48:08 +0000 Subject: [PATCH] Update 'pages/students/2016/tomas_kucharik/README.md' --- pages/students/2016/tomas_kucharik/README.md | 26 +++++++++++++++++++- 1 file changed, 25 insertions(+), 1 deletion(-) diff --git a/pages/students/2016/tomas_kucharik/README.md b/pages/students/2016/tomas_kucharik/README.md index ac26dc0658..b9b55948bd 100644 --- a/pages/students/2016/tomas_kucharik/README.md +++ b/pages/students/2016/tomas_kucharik/README.md @@ -1,4 +1,28 @@ # Tomáš Kuchárik +## Diplomový projekt 1 + +Úlohy na semester: + +- Získať a parsovať dump slovenskej wikipédie z https://dumps.wikimedia.org/mirrors.html +- Vybrať prvú množinu článkov +- Nasadiť anotačnú aplikáciu - tvorbu otázky a vyznačenie odpovede. +- Možno: natrénovať model z anglických alebo slovenských dát. + + +Úvodné stretnutie 6.3.2020. + +Porozmýšľať: + +- Ako vyberieme najlepšie články (PageRank?) +- + +Úlohy pre vedúceho: + +- Vytvoriť spoločný repozitár Prodigy +- Vytvoriť Wiki stránku pre projekt + + + ## Diplomová práca 2021 @@ -6,4 +30,4 @@ Vytváranie komplexných korpusov pre aplikácie porozumenia prirodzeného jazyk Cieľom práce je príprava nástrojov a budovanie tzv. "Question Answering datasetov" -Úvodné stretnutie 6.3.2020. +Anotácia pomocou systému [Prodigy](https://prodi.gy/docs)