Update 'pages/students/2019/michal_stromko/README.md'

This commit is contained in:
dano 2023-09-28 07:22:35 +00:00
parent f02b578ad4
commit 462bb97028

View File

@ -11,12 +11,13 @@ rok začiatku štúdia: 2019
# Diplomová práca 2023/24
Sémantické vyhľadávanie v slovenskom texte.
Sémantické vyhľadávanie vo viacjazyčnom texte.
Zadanie práce:
1. Vypracujte prehľad najnovších metód sémantického vyhľadávania pomocou neurónových sietí.
2. Vyberte vhodné metódy pre vyhľadávanie a modifikujte ich tak aby boli použiteľné pre slovenské texty.
2. Vyberte vhodné metódy pre vyhľadávanie a modifikujte ich tak aby boli použiteľné pre texty vo viacerých jazykoch.
3. Pripravte experimenty na vyhodnotenie vyhľadávania. Porovnajte vybrané metódy.
4. Vyhodnoťte experimenty a identifikujte slabé miesta a navrhnite zlepšenia.
@ -39,8 +40,9 @@ Stav:
Úlohy:
- Dajte skripty na parsovanie Wiki na GIT.
- Vytvorte a vyhoddnotte kros linguálny QA systém. Otázky v slovenčine by fungovali aj pre anglickú databázu.
- Nájdite vedecké články publikované na túto tému. Prečítajte si ch a urobte si poznámky. Aké databázy a aké spôsoby vyhodnotenia sa používajú? Systém sa skladá z dvoch modulov - informatio retrieval a question answering. Každý sa vyhodnocuje inak.
- Vytvorte a vyhoddnoťte kros linguálny QA systém. Otázky v slovenčine by fungovali aj pre anglickú databázu.
- Nájdite vedecké články publikované na túto tému. Prečítajte si ich a urobte si poznámky. Aké databázy a aké spôsoby vyhodnotenia sa používajú? Systém sa skladá z dvoch modulov - information retrieval a question answering. Každý sa vyhodnocuje inak. Vyhľadávajte "cross lingual information retrieval", "cross lingual question answering". Môže sa použiť ako esej AKT.
- Skúste vytvoriť systém na "kros linguálne" indexovanie na "information retrieval". Je potrebné zistiť, aké modely a metódy sa na to používajú. MPnet alebo LABSE?
Nápad: