Update 'pages/students/2019/michal_stromko/README.md'

This commit is contained in:
dano 2023-09-28 07:22:35 +00:00
parent f02b578ad4
commit 462bb97028

View File

@ -11,12 +11,13 @@ rok začiatku štúdia: 2019
# Diplomová práca 2023/24 # Diplomová práca 2023/24
Sémantické vyhľadávanie v slovenskom texte.
Sémantické vyhľadávanie vo viacjazyčnom texte.
Zadanie práce: Zadanie práce:
1. Vypracujte prehľad najnovších metód sémantického vyhľadávania pomocou neurónových sietí. 1. Vypracujte prehľad najnovších metód sémantického vyhľadávania pomocou neurónových sietí.
2. Vyberte vhodné metódy pre vyhľadávanie a modifikujte ich tak aby boli použiteľné pre slovenské texty. 2. Vyberte vhodné metódy pre vyhľadávanie a modifikujte ich tak aby boli použiteľné pre texty vo viacerých jazykoch.
3. Pripravte experimenty na vyhodnotenie vyhľadávania. Porovnajte vybrané metódy. 3. Pripravte experimenty na vyhodnotenie vyhľadávania. Porovnajte vybrané metódy.
4. Vyhodnoťte experimenty a identifikujte slabé miesta a navrhnite zlepšenia. 4. Vyhodnoťte experimenty a identifikujte slabé miesta a navrhnite zlepšenia.
@ -39,8 +40,9 @@ Stav:
Úlohy: Úlohy:
- Dajte skripty na parsovanie Wiki na GIT. - Dajte skripty na parsovanie Wiki na GIT.
- Vytvorte a vyhoddnotte kros linguálny QA systém. Otázky v slovenčine by fungovali aj pre anglickú databázu. - Vytvorte a vyhoddnoťte kros linguálny QA systém. Otázky v slovenčine by fungovali aj pre anglickú databázu.
- Nájdite vedecké články publikované na túto tému. Prečítajte si ch a urobte si poznámky. Aké databázy a aké spôsoby vyhodnotenia sa používajú? Systém sa skladá z dvoch modulov - informatio retrieval a question answering. Každý sa vyhodnocuje inak. - Nájdite vedecké články publikované na túto tému. Prečítajte si ich a urobte si poznámky. Aké databázy a aké spôsoby vyhodnotenia sa používajú? Systém sa skladá z dvoch modulov - information retrieval a question answering. Každý sa vyhodnocuje inak. Vyhľadávajte "cross lingual information retrieval", "cross lingual question answering". Môže sa použiť ako esej AKT.
- Skúste vytvoriť systém na "kros linguálne" indexovanie na "information retrieval". Je potrebné zistiť, aké modely a metódy sa na to používajú. MPnet alebo LABSE?
Nápad: Nápad: