diff --git a/pages/students/2016/jan_holp/dp2021/navod.md b/pages/students/2016/jan_holp/dp2021/navod.md index d02fda80..64df3b4e 100644 --- a/pages/students/2016/jan_holp/dp2021/navod.md +++ b/pages/students/2016/jan_holp/dp2021/navod.md @@ -52,7 +52,7 @@ vyhľadávať. Ukážka správneho indexovania je na obrázku : ### Vyhľadávanie Po úspešnom indexovaní môžeme začať s vyhľadávaním. Musíme si pripraviť dotaz -pre ES. Obrázok 5-4 znázorňuje komunikáciu s ES a vyhľadávanie pomocou neho. +pre ES. Obrázok znázorňuje komunikáciu s ES a vyhľadávanie pomocou neho. Odpoveď ES si môžeme pozrieť na obrázku. Sú tam zobrazené informácie o trvaní vyhľadávania v ms, počte nájdených dokumentov, indexe, v ktorom sa nachádza nájdený dokument, type, v ktorom je uložený dokument a ID dokumentu. @@ -67,8 +67,7 @@ nachádza nájdený dokument, type, v ktorom je uložený dokument a ID dokument Použijeme metódu precision-recall. V priečinku ../scnc21 sa nachádza súbor answers, ktorý obsahuje ID všetkých relevantných článkov pre každú otázku. Pri vyhľadávaní majú články ID v rozsahu 1-4871. V súbore answers majú články ID dokumentov -označené inými číslami. Preto je potrebné každému ID z nášho vyhľadávača priradiť ID zo súboru answers aby sme správne vedeli vypočítať presnosť. Keďže naše -indexovanie článkov prebiehalo načítavaním po riadkoch tak ID dokumentu, ktorý +označené inými číslami. Preto je potrebné každému ID z nášho vyhľadávača priradiť ID zo súboru answers aby sme správne vedeli vypočítať presnosť. Keďže naše indexovanie článkov prebiehalo načítavaním po riadkoch tak ID dokumentu, ktorý nám našiel vyhľadávač je vlastne číslo riadku, pomocou ktorého sme indexovali dáta. Stačí si pozrieť súbor info.txt , pomocou ktorého vieme prideliť správne ID. Potom nám stačí použiť nástroj na výpočet precision-recall, môžeme to byť npm