diff --git a/pages/topics/otvorene/README.md b/pages/topics/otvorene/README.md index c2880f6dd..eecf9ea8a 100644 --- a/pages/topics/otvorene/README.md +++ b/pages/topics/otvorene/README.md @@ -6,27 +6,64 @@ taxonomy: tag: [nn,nlp] author: Daniel Hladek --- +# Otvorené témy záverečných prác -Strojový preklad slovenského jazyka +Daniel Hládek -- Zoberte existjúci systém pre strojový preklad -- Pripravte existujúci paralelný korpus pre trénovanie + +## Bakalárske práce + +Naučíte sa: + +- niečo o spracovaní prirodzeného jazyka +- vytvárať webové aplikácie +- pracovať s nástrojmi v jazyku Python +- prekonávať technické problémy + +Požiadavky: + +- chcieť sa naučiť niečo nové + +### Demonštračný systém pre generovanie odpovede na otázku v prirodzenom jazyku + +- Natrénujte existujúci systém pre generovanie odpovede na otázku v prorodzdenom jazyku. +- Vytvorte demonštračnú webovú aplikáciu. + +### Strojový preklad slovenského jazyka + +- Zoberte existjúci systém pre strojový preklad. +- Pripravte existujúci paralelný korpus pre trénovanie. - Vytvorte model pre strojový preklad slovenského jazyka. -Rozpoznávanie pomenovaných entít: +### Rozpoznávanie pomenovaných entít v slovenskom jazyku -- Zlepšite model pre rozpoznávanie pomenovaných entít +- Zlepšite model pre rozpoznávanie pomenovaných entít +- Anotujte korpus, navrhnite lepší klasifikátor. -Morfologická analýza s podporou predtrénovania: - -- Zoberte existujúci model pre morfologickú anlaýzu slovenského jazyka vyhodnotte ho -- Použite BERT model na natrénovanie morfologickej anotácie a pporovnajte presnosť so základným modelom. - -Vyhľadávač na slovenskom internete +### Vyhľadávač na slovenskom internete - Vytvorte index pre vyhľadávanie v databáze slovenských stránok (Cassandra, Elasticseaech). - Vytvorte webové rozhranie k vyhľadávaču +## Diplomové práce + +Naučíte sa: + +- Niečo viac o neurónových sieťach. +- Vytvárať jednoduché programy na úpravu dát. +- Zapojiť sa do reálneho výskumu. + +### Morfologická analýza s podporou predtrénovania + +- Zoberte existujúci model pre morfologickú analýzu slovenského jazyka vyhodnotte ho +- Použite BERT model na natrénovanie morfologickej anotácie a porovnajte presnosť so základným modelom. + +### Slovné jednotky v predspracovaní pre strojový preklad + +- Natrénujte systém pre strojový preklad +- Vytvorte niekoľko modelov pre rozdelenie slov na menšie jednotky v slovenskom jazyku. Pre každý model rozdelenia slov natrénujte systém pre strojový preklad. +- Porovnajte výsledky strojového prekladu s rôznymi rozdeleniami slov. +