diff --git a/pages/students/2016/jan_holp/dp2021/README.md b/pages/students/2016/jan_holp/dp2021/README.md index 8c8068cb6b..49ecf9662b 100644 --- a/pages/students/2016/jan_holp/dp2021/README.md +++ b/pages/students/2016/jan_holp/dp2021/README.md @@ -65,4 +65,16 @@ nachádza nájdený dokument, type, v ktorom je uložený dokument a ID dokument ![Odpoveď]( odpoved.PNG) +### Výpočet presnosti + +Použijeme metódu precision-recall. V priečinku ../scnc21 sa nachádza súbor answers, +ktorý obsahuje ID všetkých relevantných článkov pre každú otázku. Pri vyhľadávaní +majú články ID v rozsahu 1-4871. V súbore answers majú články ID dokumentov +označené inými číslami. Preto je potrebné každému ID z nášho vyhľadávača priradiť ID zo súboru answers aby sme správne vedeli vypočítať presnosť. Keďže naše +indexovanie článkov prebiehalo načítavaním po riadkoch tak ID dokumentu, ktorý +nám našiel vyhľadávač je vlastne číslo riadku, pomocou ktorého sme indexovali dáta. +Stačí si pozrieť súbor info.txt , pomocou ktorého vieme prideliť správne ID. +Potom nám stačí použiť nástroj na výpočet precision-recall, môžeme to byť npm +balíček precision-recall alebo online kalkulátor. Ak vypočítame presnosť pre každú +otázku na záver stačí vypočítať aritmetický priemer všetkých otázok.