forked from KEMT/zpwiki
Update 'pages/students/2016/jan_holp/dp2021/navod.md'
This commit is contained in:
parent
709442962b
commit
bb6a75ff45
@ -52,7 +52,7 @@ vyhľadávať. Ukážka správneho indexovania je na obrázku :
|
||||
### Vyhľadávanie
|
||||
|
||||
Po úspešnom indexovaní môžeme začať s vyhľadávaním. Musíme si pripraviť dotaz
|
||||
pre ES. Obrázok 5-4 znázorňuje komunikáciu s ES a vyhľadávanie pomocou neho.
|
||||
pre ES. Obrázok znázorňuje komunikáciu s ES a vyhľadávanie pomocou neho.
|
||||
Odpoveď ES si môžeme pozrieť na obrázku. Sú tam zobrazené informácie
|
||||
o trvaní vyhľadávania v ms, počte nájdených dokumentov, indexe, v ktorom sa
|
||||
nachádza nájdený dokument, type, v ktorom je uložený dokument a ID dokumentu.
|
||||
@ -67,8 +67,7 @@ nachádza nájdený dokument, type, v ktorom je uložený dokument a ID dokument
|
||||
Použijeme metódu precision-recall. V priečinku ../scnc21 sa nachádza súbor answers,
|
||||
ktorý obsahuje ID všetkých relevantných článkov pre každú otázku. Pri vyhľadávaní
|
||||
majú články ID v rozsahu 1-4871. V súbore answers majú články ID dokumentov
|
||||
označené inými číslami. Preto je potrebné každému ID z nášho vyhľadávača priradiť ID zo súboru answers aby sme správne vedeli vypočítať presnosť. Keďže naše
|
||||
indexovanie článkov prebiehalo načítavaním po riadkoch tak ID dokumentu, ktorý
|
||||
označené inými číslami. Preto je potrebné každému ID z nášho vyhľadávača priradiť ID zo súboru answers aby sme správne vedeli vypočítať presnosť. Keďže naše indexovanie článkov prebiehalo načítavaním po riadkoch tak ID dokumentu, ktorý
|
||||
nám našiel vyhľadávač je vlastne číslo riadku, pomocou ktorého sme indexovali dáta.
|
||||
Stačí si pozrieť súbor info.txt , pomocou ktorého vieme prideliť správne ID.
|
||||
Potom nám stačí použiť nástroj na výpočet precision-recall, môžeme to byť npm
|
||||
|
Loading…
Reference in New Issue
Block a user