forked from KEMT/zpwiki
zz
This commit is contained in:
parent
e8119f251e
commit
5b433edad0
@ -19,7 +19,12 @@ Požiadavky:
|
||||
|
||||
## Témy
|
||||
|
||||
### Demonštračný systém pre generovanie odpovede na otázku v prirodzenom jazyku
|
||||
### Automatické odpovede z Wikipédie
|
||||
|
||||
1. Vypracujte prehľad aktuálnych metód pre generovanie odpovede na otázku v prirodzenom jazyku
|
||||
2. Natrénujte existujúci systém pre generovanie odpovede na otázku v prirodzenom jazyku.
|
||||
3. Vytvorte demonštračnú webovú aplikáciu.
|
||||
4. Navrhnite zlepšenia systému pre generovanie odpovede.
|
||||
|
||||
- Natrénujte existujúci systém pre generovanie odpovede na otázku v prirodzenom jazyku.
|
||||
- Vytvorte demonštračnú webovú aplikáciu.
|
||||
@ -30,13 +35,42 @@ Požiadavky:
|
||||
- Pripravte existujúci paralelný korpus pre trénovanie.
|
||||
- Vytvorte model pre strojový preklad slovenského jazyka.
|
||||
|
||||
1. Vypracujte prehľad aktuálnych metód pre generovanie odpovede na otázku v prirodzenom jazyku
|
||||
2. Natrénujte existujúci systém pre generovanie odpovede na otázku v prirodzenom jazyku.
|
||||
3. Vytvorte demonštračnú webovú aplikáciu.
|
||||
4. Navrhnite zlepšenia systému pre generovanie odpovede.
|
||||
|
||||
### Rozpoznávanie pomenovaných entít v slovenskom jazyku
|
||||
|
||||
- Zlepšite model pre rozpoznávanie pomenovaných entít.
|
||||
- Anotujte korpus, navrhnite lepší klasifikátor.
|
||||
|
||||
Pomenované entity sú väčšinou vlastné podstatné mená v texte. Ich rozpoznanie nám pomôže určiť o čom text je. To sa často využíva v chatbotoch alebo vo vyhľadávaní v texte.
|
||||
|
||||
1. Vypracujte prehľad metód rpre rozpoznávanie pomenovaných entít v texte.
|
||||
2. Vyberte vhodnú metódu a natrénujte model pre rozpoznávanie pomenovaných entít.
|
||||
3. Vykonajte viacero experimentov a zistite s akými parametrami má model najvyššiu presnosť.
|
||||
4. Navrhnite ďalšie zlepšenia modelu pre rozpoznávanie pomenovaných entít.
|
||||
|
||||
### Vyhľadávač na slovenskom internete
|
||||
|
||||
Databáza dokumentov je k dispozícii. Na vytvorenie indexu je možné použiť Elasticsearch alebo podobný systém.
|
||||
Dokument je potrebné spracovať pomocou skriptu v jazyku Python alebo Javascript.
|
||||
|
||||
- Vytvorte index pre vyhľadávanie v databáze slovenských stránok (Cassandra, Elasticseaech).
|
||||
- Vytvorte webové rozhranie k vyhľadávaču.
|
||||
|
||||
1. Vypracujte prehľad metód pre získavanie informácií.
|
||||
2. Vytvorte vyhľadávací index dokumentov zo slovenského internetu.
|
||||
3. Vytvorte demonštračnú webovú aplikáciu pre vyhľadávanie na slovenskom internete.
|
||||
4. Navrhnite zlepšenia vyhľadávania.
|
||||
|
||||
### Model Spacy pre spracovanie prirodzeného jazyka
|
||||
|
||||
Knižnica Spacy je často používaný nástroj na spracovanie prirodzeného jazyka.
|
||||
Dobrý model slovenčiny pomože pri vývoji virtuálnych asistentov a iných nástrojov.
|
||||
|
||||
1. Zistite ako pracuje knižnica Spacy a opíšte metódy ktoré používa.
|
||||
2. Natrénujte model pre spracovanie slovenského prirodzeného jazyka.
|
||||
3. Indentifikujte slabé miesta a zlepšite presnosť spracovania.
|
||||
4. Vykonajte viacero experimentov a zistite presnosť pri rôznych parametroch.
|
||||
|
Loading…
Reference in New Issue
Block a user