Update 'pages/students/2016/jan_holp/dp2021/navod.md'

This commit is contained in:
Ján Holp 2020-04-08 16:19:14 +00:00
parent 709442962b
commit bb6a75ff45

View File

@ -52,7 +52,7 @@ vyhľadávať. Ukážka správneho indexovania je na obrázku :
### Vyhľadávanie
Po úspešnom indexovaní môžeme začať s vyhľadávaním. Musíme si pripraviť dotaz
pre ES. Obrázok 5-4 znázorňuje komunikáciu s ES a vyhľadávanie pomocou neho.
pre ES. Obrázok znázorňuje komunikáciu s ES a vyhľadávanie pomocou neho.
Odpoveď ES si môžeme pozrieť na obrázku. Sú tam zobrazené informácie
o trvaní vyhľadávania v ms, počte nájdených dokumentov, indexe, v ktorom sa
nachádza nájdený dokument, type, v ktorom je uložený dokument a ID dokumentu.
@ -67,8 +67,7 @@ nachádza nájdený dokument, type, v ktorom je uložený dokument a ID dokument
Použijeme metódu precision-recall. V priečinku ../scnc21 sa nachádza súbor answers,
ktorý obsahuje ID všetkých relevantných článkov pre každú otázku. Pri vyhľadávaní
majú články ID v rozsahu 1-4871. V súbore answers majú články ID dokumentov
označené inými číslami. Preto je potrebné každému ID z nášho vyhľadávača priradiť ID zo súboru answers aby sme správne vedeli vypočítať presnosť. Keďže naše
indexovanie článkov prebiehalo načítavaním po riadkoch tak ID dokumentu, ktorý
označené inými číslami. Preto je potrebné každému ID z nášho vyhľadávača priradiť ID zo súboru answers aby sme správne vedeli vypočítať presnosť. Keďže naše indexovanie článkov prebiehalo načítavaním po riadkoch tak ID dokumentu, ktorý
nám našiel vyhľadávač je vlastne číslo riadku, pomocou ktorého sme indexovali dáta.
Stačí si pozrieť súbor info.txt , pomocou ktorého vieme prideliť správne ID.
Potom nám stačí použiť nástroj na výpočet precision-recall, môžeme to byť npm