Update 'pages/students/2016/jan_holp/dp2021/navod.md'
This commit is contained in:
parent
709442962b
commit
bb6a75ff45
@ -52,7 +52,7 @@ vyhľadávať. Ukážka správneho indexovania je na obrázku :
|
|||||||
### Vyhľadávanie
|
### Vyhľadávanie
|
||||||
|
|
||||||
Po úspešnom indexovaní môžeme začať s vyhľadávaním. Musíme si pripraviť dotaz
|
Po úspešnom indexovaní môžeme začať s vyhľadávaním. Musíme si pripraviť dotaz
|
||||||
pre ES. Obrázok 5-4 znázorňuje komunikáciu s ES a vyhľadávanie pomocou neho.
|
pre ES. Obrázok znázorňuje komunikáciu s ES a vyhľadávanie pomocou neho.
|
||||||
Odpoveď ES si môžeme pozrieť na obrázku. Sú tam zobrazené informácie
|
Odpoveď ES si môžeme pozrieť na obrázku. Sú tam zobrazené informácie
|
||||||
o trvaní vyhľadávania v ms, počte nájdených dokumentov, indexe, v ktorom sa
|
o trvaní vyhľadávania v ms, počte nájdených dokumentov, indexe, v ktorom sa
|
||||||
nachádza nájdený dokument, type, v ktorom je uložený dokument a ID dokumentu.
|
nachádza nájdený dokument, type, v ktorom je uložený dokument a ID dokumentu.
|
||||||
@ -67,8 +67,7 @@ nachádza nájdený dokument, type, v ktorom je uložený dokument a ID dokument
|
|||||||
Použijeme metódu precision-recall. V priečinku ../scnc21 sa nachádza súbor answers,
|
Použijeme metódu precision-recall. V priečinku ../scnc21 sa nachádza súbor answers,
|
||||||
ktorý obsahuje ID všetkých relevantných článkov pre každú otázku. Pri vyhľadávaní
|
ktorý obsahuje ID všetkých relevantných článkov pre každú otázku. Pri vyhľadávaní
|
||||||
majú články ID v rozsahu 1-4871. V súbore answers majú články ID dokumentov
|
majú články ID v rozsahu 1-4871. V súbore answers majú články ID dokumentov
|
||||||
označené inými číslami. Preto je potrebné každému ID z nášho vyhľadávača priradiť ID zo súboru answers aby sme správne vedeli vypočítať presnosť. Keďže naše
|
označené inými číslami. Preto je potrebné každému ID z nášho vyhľadávača priradiť ID zo súboru answers aby sme správne vedeli vypočítať presnosť. Keďže naše indexovanie článkov prebiehalo načítavaním po riadkoch tak ID dokumentu, ktorý
|
||||||
indexovanie článkov prebiehalo načítavaním po riadkoch tak ID dokumentu, ktorý
|
|
||||||
nám našiel vyhľadávač je vlastne číslo riadku, pomocou ktorého sme indexovali dáta.
|
nám našiel vyhľadávač je vlastne číslo riadku, pomocou ktorého sme indexovali dáta.
|
||||||
Stačí si pozrieť súbor info.txt , pomocou ktorého vieme prideliť správne ID.
|
Stačí si pozrieť súbor info.txt , pomocou ktorého vieme prideliť správne ID.
|
||||||
Potom nám stačí použiť nástroj na výpočet precision-recall, môžeme to byť npm
|
Potom nám stačí použiť nástroj na výpočet precision-recall, môžeme to byť npm
|
||||||
|
Loading…
Reference in New Issue
Block a user