Update 'pages/students/2016/jan_holp/dp2021/README.md'

This commit is contained in:
Ján Holp 2020-04-08 15:45:28 +00:00
parent 1fcfed2822
commit a1169c8b77

View File

@ -65,4 +65,16 @@ nachádza nájdený dokument, type, v ktorom je uložený dokument a ID dokument
![Odpoveď]( odpoved.PNG) ![Odpoveď]( odpoved.PNG)
### Výpočet presnosti
Použijeme metódu precision-recall. V priečinku ../scnc21 sa nachádza súbor answers,
ktorý obsahuje ID všetkých relevantných článkov pre každú otázku. Pri vyhľadávaní
majú články ID v rozsahu 1-4871. V súbore answers majú články ID dokumentov
označené inými číslami. Preto je potrebné každému ID z nášho vyhľadávača priradiť ID zo súboru answers aby sme správne vedeli vypočítať presnosť. Keďže naše
indexovanie článkov prebiehalo načítavaním po riadkoch tak ID dokumentu, ktorý
nám našiel vyhľadávač je vlastne číslo riadku, pomocou ktorého sme indexovali dáta.
Stačí si pozrieť súbor info.txt , pomocou ktorého vieme prideliť správne ID.
Potom nám stačí použiť nástroj na výpočet precision-recall, môžeme to byť npm
balíček precision-recall alebo online kalkulátor. Ak vypočítame presnosť pre každú
otázku na záver stačí vypočítať aritmetický priemer všetkých otázok.