diff --git a/pages/students/2019/michal_stromko/README.md b/pages/students/2019/michal_stromko/README.md index cdbec20f..98cec385 100644 --- a/pages/students/2019/michal_stromko/README.md +++ b/pages/students/2019/michal_stromko/README.md @@ -11,12 +11,13 @@ rok začiatku štúdia: 2019 # Diplomová práca 2023/24 -Sémantické vyhľadávanie v slovenskom texte. + +Sémantické vyhľadávanie vo viacjazyčnom texte. Zadanie práce: 1. Vypracujte prehľad najnovších metód sémantického vyhľadávania pomocou neurónových sietí. -2. Vyberte vhodné metódy pre vyhľadávanie a modifikujte ich tak aby boli použiteľné pre slovenské texty. +2. Vyberte vhodné metódy pre vyhľadávanie a modifikujte ich tak aby boli použiteľné pre texty vo viacerých jazykoch. 3. Pripravte experimenty na vyhodnotenie vyhľadávania. Porovnajte vybrané metódy. 4. Vyhodnoťte experimenty a identifikujte slabé miesta a navrhnite zlepšenia. @@ -39,8 +40,9 @@ Stav: Úlohy: - Dajte skripty na parsovanie Wiki na GIT. -- Vytvorte a vyhoddnotte kros linguálny QA systém. Otázky v slovenčine by fungovali aj pre anglickú databázu. -- Nájdite vedecké články publikované na túto tému. Prečítajte si ch a urobte si poznámky. Aké databázy a aké spôsoby vyhodnotenia sa používajú? Systém sa skladá z dvoch modulov - informatio retrieval a question answering. Každý sa vyhodnocuje inak. +- Vytvorte a vyhoddnoťte kros linguálny QA systém. Otázky v slovenčine by fungovali aj pre anglickú databázu. +- Nájdite vedecké články publikované na túto tému. Prečítajte si ich a urobte si poznámky. Aké databázy a aké spôsoby vyhodnotenia sa používajú? Systém sa skladá z dvoch modulov - information retrieval a question answering. Každý sa vyhodnocuje inak. Vyhľadávajte "cross lingual information retrieval", "cross lingual question answering". Môže sa použiť ako esej AKT. +- Skúste vytvoriť systém na "kros linguálne" indexovanie na "information retrieval". Je potrebné zistiť, aké modely a metódy sa na to používajú. MPnet alebo LABSE? Nápad: