--- title: Otvorené projekty published: true taxonomy: category: [info] tag: [nn,nlp] author: Daniel Hladek --- # Otvorené témy záverečných prác Daniel Hládek ## Bakalárske práce Naučíte sa: - niečo o spracovaní prirodzeného jazyka - vytvárať webové aplikácie - pracovať s nástrojmi v jazyku Python - prekonávať technické problémy Požiadavky: - chcieť sa naučiť niečo nové ### Demonštračný systém pre generovanie odpovede na otázku v prirodzenom jazyku - Natrénujte existujúci systém pre generovanie odpovede na otázku v prorodzdenom jazyku. - Vytvorte demonštračnú webovú aplikáciu. ### Strojový preklad slovenského jazyka - Zoberte existjúci systém pre strojový preklad. - Pripravte existujúci paralelný korpus pre trénovanie. - Vytvorte model pre strojový preklad slovenského jazyka. ### Rozpoznávanie pomenovaných entít v slovenskom jazyku - Zlepšite model pre rozpoznávanie pomenovaných entít - Anotujte korpus, navrhnite lepší klasifikátor. ### Vyhľadávač na slovenskom internete - Vytvorte index pre vyhľadávanie v databáze slovenských stránok (Cassandra, Elasticseaech). - Vytvorte webové rozhranie k vyhľadávaču ## Diplomové práce Naučíte sa: - Niečo viac o neurónových sieťach. - Vytvárať jednoduché programy na úpravu dát. - Zapojiť sa do reálneho výskumu. ### Morfologická analýza s podporou predtrénovania - Zoberte existujúci model pre morfologickú analýzu slovenského jazyka vyhodnotte ho - Použite BERT model na natrénovanie morfologickej anotácie a porovnajte presnosť so základným modelom. ### Slovné jednotky v predspracovaní pre strojový preklad - Natrénujte systém pre strojový preklad - Vytvorte niekoľko modelov pre rozdelenie slov na menšie jednotky v slovenskom jazyku. Pre každý model rozdelenia slov natrénujte systém pre strojový preklad. - Porovnajte výsledky strojového prekladu s rôznymi rozdeleniami slov.