From e8119f251eeaf6fbd46f471197b0e4701607a9bb Mon Sep 17 00:00:00 2001 From: Daniel Hladek Date: Thu, 13 May 2021 11:27:44 +0200 Subject: [PATCH] zz --- pages/04.categories/bp2022/category.md | 42 ++++++++++++++++++++++++++ pages/04.categories/dp2022/category.md | 23 ++++++++++++++ 2 files changed, 65 insertions(+) create mode 100644 pages/04.categories/bp2022/category.md diff --git a/pages/04.categories/bp2022/category.md b/pages/04.categories/bp2022/category.md new file mode 100644 index 000000000..d9dcabd7c --- /dev/null +++ b/pages/04.categories/bp2022/category.md @@ -0,0 +1,42 @@ +--- +title: Bakalárske práce 2021/2022 +category: bp2022 +--- +# Bakalárske práce 2022 + +Ak ste študentom 2. alebo 3. ročníka odboru Počítačové siete na KEMT a máte záujem o niektorú z týchto tém, napíšte e-mail na daniel.hladek@tuke.sk. + +Naučíte sa: + +- niečo o spracovaní prirodzeného jazyka +- vytvárať webové aplikácie +- pracovať s nástrojmi v jazyku Python +- prekonávať technické problémy + +Požiadavky: + +- chcieť sa naučiť niečo nové + +## Témy + +### Demonštračný systém pre generovanie odpovede na otázku v prirodzenom jazyku + +- Natrénujte existujúci systém pre generovanie odpovede na otázku v prirodzenom jazyku. +- Vytvorte demonštračnú webovú aplikáciu. + +### Strojový preklad slovenského jazyka + +- Zoberte existujúci systém pre strojový preklad. +- Pripravte existujúci paralelný korpus pre trénovanie. +- Vytvorte model pre strojový preklad slovenského jazyka. + +### Rozpoznávanie pomenovaných entít v slovenskom jazyku + +- Zlepšite model pre rozpoznávanie pomenovaných entít. +- Anotujte korpus, navrhnite lepší klasifikátor. + +### Vyhľadávač na slovenskom internete + +- Vytvorte index pre vyhľadávanie v databáze slovenských stránok (Cassandra, Elasticseaech). +- Vytvorte webové rozhranie k vyhľadávaču. + diff --git a/pages/04.categories/dp2022/category.md b/pages/04.categories/dp2022/category.md index bb152a7e4..24395b2f8 100644 --- a/pages/04.categories/dp2022/category.md +++ b/pages/04.categories/dp2022/category.md @@ -4,4 +4,27 @@ category: dp2022 published: true --- +Naučíte sa: + +- Niečo viac o neurónových sieťach. +- Vytvárať jednoduché programy na úpravu dát. +- Zapojiť sa do reálneho výskumu. + +### Morfologická analýza s podporou predtrénovania + +- Zoberte existujúci model pre morfologickú analýzu slovenského jazyka a vyhodnotte ho. +- Použite BERT model na natrénovanie morfologickej anotácie a porovnajte presnosť so základným modelom. + +### Slovné jednotky v predspracovaní pre strojový preklad + +- Natrénujte systém pre strojový preklad +- Vytvorte niekoľko modelov pre rozdelenie slov na menšie jednotky v slovenskom jazyku. Pre každý model rozdelenia slov natrénujte systém pre strojový preklad. +- Porovnajte výsledky strojového prekladu s rôznymi rozdeleniami slov. + + +### Spracovanie veľkých dát pre účely získavania informácií + +- Naučte sa pracovať s databázou Cassandra a Python +- indexujte dáta z webu +- implementujte techniku vyhodnotenia dokumentov