forked from KEMT/zpwiki
		
	Update 'pages/students/2016/jan_holp/timovy_projekt/README.md'
This commit is contained in:
		
							parent
							
								
									ff251dfc0d
								
							
						
					
					
						commit
						bdee5b341b
					
				| @ -36,7 +36,7 @@ PageRank funguje spočítaním počtu a kvality odkazov na stránku, aby určil | ||||
| 
 | ||||
| PageRank vyjadruje hodnotenie v percentách. Algoritmus Googlu používa logaritmické vyjadrenie. Na obrázku môžeme vidieť, že stránka s označením C má vyšší PageRank ako stránka E, aj keď je na stránku E viacero odkazov. PageRank  vypočítame podľa tohto vzorca :  | ||||
| 
 | ||||
| 
 | ||||
|  | ||||
| 
 | ||||
| Kde P(d) je pravdepodobnosť zobrazenia stránky d, P(di) je pravdepodobnosť zobrazenia stránky di a M(d) je množina stránok pripojená k d, L(di) je počet odkazov grafu, α je váha.  | ||||
| 
 | ||||
| @ -44,6 +44,7 @@ Kde P(d) je pravdepodobnosť zobrazenia stránky d, P(di) je pravdepodobnosť zo | ||||
| Pri získavaní informácií je Okapi BM25 algoritmus hodnotenia, ktorý používajú vyhľadávacie nástroje na odhad relevantnosti dokumentov pre daný vyhľadávací dopyt. Je založený na pravdepodobnostnom vyhľadávacom rámci, ktorý v 70. a 80. rokoch 20. storočia vypracovali Stephen E. Robertson , Karen Spärck Jones a ďalší.  | ||||
| BM25 je funkcia získavania slov, ktorá hodnotí skupinu dokumentov na základe výrazov, ktoré sa objavujú v každom dokumente. Vypočíta sa podľa tohto vzorca :  | ||||
| 
 | ||||
|  | ||||
| 
 | ||||
| Kde w označuje slovo v dokumente d, a q, t𝒇(𝒘) označujú frekvenciu slov v dokumente  d. id𝒇(𝒘) označuje inverznú frekvenciu slov w v dokumente.  dl označuje dĺžku dokumentu d, avgdl označuje priemernú dĺžku dokumentu,  b aj k sú konštanty.  | ||||
|   | ||||
|  | ||||
		Loading…
	
		Reference in New Issue
	
	Block a user