From a1169c8b775fc78db4f66e291bec65ddc1b11c67 Mon Sep 17 00:00:00 2001 From: =?UTF-8?q?J=C3=A1n=20Holp?= Date: Wed, 8 Apr 2020 15:45:28 +0000 Subject: [PATCH] Update 'pages/students/2016/jan_holp/dp2021/README.md' --- pages/students/2016/jan_holp/dp2021/README.md | 12 ++++++++++++ 1 file changed, 12 insertions(+) diff --git a/pages/students/2016/jan_holp/dp2021/README.md b/pages/students/2016/jan_holp/dp2021/README.md index 8c8068cb..49ecf966 100644 --- a/pages/students/2016/jan_holp/dp2021/README.md +++ b/pages/students/2016/jan_holp/dp2021/README.md @@ -65,4 +65,16 @@ nachádza nájdený dokument, type, v ktorom je uložený dokument a ID dokument ![Odpoveď]( odpoved.PNG) +### Výpočet presnosti + +Použijeme metódu precision-recall. V priečinku ../scnc21 sa nachádza súbor answers, +ktorý obsahuje ID všetkých relevantných článkov pre každú otázku. Pri vyhľadávaní +majú články ID v rozsahu 1-4871. V súbore answers majú články ID dokumentov +označené inými číslami. Preto je potrebné každému ID z nášho vyhľadávača priradiť ID zo súboru answers aby sme správne vedeli vypočítať presnosť. Keďže naše +indexovanie článkov prebiehalo načítavaním po riadkoch tak ID dokumentu, ktorý +nám našiel vyhľadávač je vlastne číslo riadku, pomocou ktorého sme indexovali dáta. +Stačí si pozrieť súbor info.txt , pomocou ktorého vieme prideliť správne ID. +Potom nám stačí použiť nástroj na výpočet precision-recall, môžeme to byť npm +balíček precision-recall alebo online kalkulátor. Ak vypočítame presnosť pre každú +otázku na záver stačí vypočítať aritmetický priemer všetkých otázok.