forked from KEMT/zpwiki
Update 'pages/students/2016/jan_holp/timovy_projekt/README.md'
This commit is contained in:
parent
bdee5b341b
commit
1258337271
@ -36,7 +36,7 @@ PageRank funguje spočítaním počtu a kvality odkazov na stránku, aby určil
|
||||
|
||||
PageRank vyjadruje hodnotenie v percentách. Algoritmus Googlu používa logaritmické vyjadrenie. Na obrázku môžeme vidieť, že stránka s označením C má vyšší PageRank ako stránka E, aj keď je na stránku E viacero odkazov. PageRank vypočítame podľa tohto vzorca :
|
||||
|
||||

|
||||

|
||||
|
||||
Kde P(d) je pravdepodobnosť zobrazenia stránky d, P(di) je pravdepodobnosť zobrazenia stránky di a M(d) je množina stránok pripojená k d, L(di) je počet odkazov grafu, α je váha.
|
||||
|
||||
@ -44,7 +44,7 @@ Kde P(d) je pravdepodobnosť zobrazenia stránky d, P(di) je pravdepodobnosť zo
|
||||
Pri získavaní informácií je Okapi BM25 algoritmus hodnotenia, ktorý používajú vyhľadávacie nástroje na odhad relevantnosti dokumentov pre daný vyhľadávací dopyt. Je založený na pravdepodobnostnom vyhľadávacom rámci, ktorý v 70. a 80. rokoch 20. storočia vypracovali Stephen E. Robertson , Karen Spärck Jones a ďalší.
|
||||
BM25 je funkcia získavania slov, ktorá hodnotí skupinu dokumentov na základe výrazov, ktoré sa objavujú v každom dokumente. Vypočíta sa podľa tohto vzorca :
|
||||
|
||||

|
||||

|
||||
|
||||
Kde w označuje slovo v dokumente d, a q, t𝒇(𝒘) označujú frekvenciu slov v dokumente d. id𝒇(𝒘) označuje inverznú frekvenciu slov w v dokumente. dl označuje dĺžku dokumentu d, avgdl označuje priemernú dĺžku dokumentu, b aj k sú konštanty.
|
||||
|
||||
|
Loading…
Reference in New Issue
Block a user