From 1258337271e66bea21bc2b022cd323ac7b5a80d2 Mon Sep 17 00:00:00 2001 From: =?UTF-8?q?J=C3=A1n=20Holp?= Date: Wed, 29 Jan 2020 17:23:16 +0000 Subject: [PATCH] Update 'pages/students/2016/jan_holp/timovy_projekt/README.md' --- pages/students/2016/jan_holp/timovy_projekt/README.md | 4 ++-- 1 file changed, 2 insertions(+), 2 deletions(-) diff --git a/pages/students/2016/jan_holp/timovy_projekt/README.md b/pages/students/2016/jan_holp/timovy_projekt/README.md index 2eccc516..68ab63ca 100644 --- a/pages/students/2016/jan_holp/timovy_projekt/README.md +++ b/pages/students/2016/jan_holp/timovy_projekt/README.md @@ -36,7 +36,7 @@ PageRank funguje spočítaním počtu a kvality odkazov na stránku, aby určil PageRank vyjadruje hodnotenie v percentách. Algoritmus Googlu používa logaritmické vyjadrenie. Na obrázku môžeme vidieť, že stránka s označením C má vyšší PageRank ako stránka E, aj keď je na stránku E viacero odkazov. PageRank vypočítame podľa tohto vzorca : -![vzorec](vzorec1.jpg) +![vzorec](vzorec1.PNG) Kde P(d) je pravdepodobnosť zobrazenia stránky d, P(di) je pravdepodobnosť zobrazenia stránky di a M(d) je množina stránok pripojená k d, L(di) je počet odkazov grafu, α je váha. @@ -44,7 +44,7 @@ Kde P(d) je pravdepodobnosť zobrazenia stránky d, P(di) je pravdepodobnosť zo Pri získavaní informácií je Okapi BM25 algoritmus hodnotenia, ktorý používajú vyhľadávacie nástroje na odhad relevantnosti dokumentov pre daný vyhľadávací dopyt. Je založený na pravdepodobnostnom vyhľadávacom rámci, ktorý v 70. a 80. rokoch 20. storočia vypracovali Stephen E. Robertson , Karen Spärck Jones a ďalší. BM25 je funkcia získavania slov, ktorá hodnotí skupinu dokumentov na základe výrazov, ktoré sa objavujú v každom dokumente. Vypočíta sa podľa tohto vzorca : -![vzorec](vzorec2.jpg) +![vzorec](vzorec2.PNG) Kde w označuje slovo v dokumente d, a q, t𝒇(𝒘) označujú frekvenciu slov v dokumente d. id𝒇(𝒘) označuje inverznú frekvenciu slov w v dokumente. dl označuje dĺžku dokumentu d, avgdl označuje priemernú dĺžku dokumentu, b aj k sú konštanty.