diff --git a/pages/students/2016/jan_holp/timovy_projekt/README.md b/pages/students/2016/jan_holp/timovy_projekt/README.md index da7bc718b4..2eccc516a3 100644 --- a/pages/students/2016/jan_holp/timovy_projekt/README.md +++ b/pages/students/2016/jan_holp/timovy_projekt/README.md @@ -36,7 +36,7 @@ PageRank funguje spočítaním počtu a kvality odkazov na stránku, aby určil PageRank vyjadruje hodnotenie v percentách. Algoritmus Googlu používa logaritmické vyjadrenie. Na obrázku môžeme vidieť, že stránka s označením C má vyšší PageRank ako stránka E, aj keď je na stránku E viacero odkazov. PageRank vypočítame podľa tohto vzorca : - +![vzorec](vzorec1.jpg) Kde P(d) je pravdepodobnosť zobrazenia stránky d, P(di) je pravdepodobnosť zobrazenia stránky di a M(d) je množina stránok pripojená k d, L(di) je počet odkazov grafu, α je váha. @@ -44,6 +44,7 @@ Kde P(d) je pravdepodobnosť zobrazenia stránky d, P(di) je pravdepodobnosť zo Pri získavaní informácií je Okapi BM25 algoritmus hodnotenia, ktorý používajú vyhľadávacie nástroje na odhad relevantnosti dokumentov pre daný vyhľadávací dopyt. Je založený na pravdepodobnostnom vyhľadávacom rámci, ktorý v 70. a 80. rokoch 20. storočia vypracovali Stephen E. Robertson , Karen Spärck Jones a ďalší. BM25 je funkcia získavania slov, ktorá hodnotí skupinu dokumentov na základe výrazov, ktoré sa objavujú v každom dokumente. Vypočíta sa podľa tohto vzorca : +![vzorec](vzorec2.jpg) Kde w označuje slovo v dokumente d, a q, t𝒇(𝒘) označujú frekvenciu slov v dokumente d. id𝒇(𝒘) označuje inverznú frekvenciu slov w v dokumente. dl označuje dĺžku dokumentu d, avgdl označuje priemernú dĺžku dokumentu, b aj k sú konštanty.