forked from KEMT/zpwiki
Update 'pages/students/2016/jan_holp/timovy_projekt/README.md'
This commit is contained in:
parent
ff251dfc0d
commit
bdee5b341b
@ -36,7 +36,7 @@ PageRank funguje spočítaním počtu a kvality odkazov na stránku, aby určil
|
||||
|
||||
PageRank vyjadruje hodnotenie v percentách. Algoritmus Googlu používa logaritmické vyjadrenie. Na obrázku môžeme vidieť, že stránka s označením C má vyšší PageRank ako stránka E, aj keď je na stránku E viacero odkazov. PageRank vypočítame podľa tohto vzorca :
|
||||
|
||||
|
||||
![vzorec](vzorec1.jpg)
|
||||
|
||||
Kde P(d) je pravdepodobnosť zobrazenia stránky d, P(di) je pravdepodobnosť zobrazenia stránky di a M(d) je množina stránok pripojená k d, L(di) je počet odkazov grafu, α je váha.
|
||||
|
||||
@ -44,6 +44,7 @@ Kde P(d) je pravdepodobnosť zobrazenia stránky d, P(di) je pravdepodobnosť zo
|
||||
Pri získavaní informácií je Okapi BM25 algoritmus hodnotenia, ktorý používajú vyhľadávacie nástroje na odhad relevantnosti dokumentov pre daný vyhľadávací dopyt. Je založený na pravdepodobnostnom vyhľadávacom rámci, ktorý v 70. a 80. rokoch 20. storočia vypracovali Stephen E. Robertson , Karen Spärck Jones a ďalší.
|
||||
BM25 je funkcia získavania slov, ktorá hodnotí skupinu dokumentov na základe výrazov, ktoré sa objavujú v každom dokumente. Vypočíta sa podľa tohto vzorca :
|
||||
|
||||
![vzorec](vzorec2.jpg)
|
||||
|
||||
Kde w označuje slovo v dokumente d, a q, t𝒇(𝒘) označujú frekvenciu slov v dokumente d. id𝒇(𝒘) označuje inverznú frekvenciu slov w v dokumente. dl označuje dĺžku dokumentu d, avgdl označuje priemernú dĺžku dokumentu, b aj k sú konštanty.
|
||||
|
||||
|
Loading…
Reference in New Issue
Block a user