PageRank (PR) je spôsob, akým Google meria tzv. odkazovú popularitu stránky. Algoritmus predpokladá, že ak jedna stránka odkazuje na inú, hlasuje tým za jej “dôležitosť”. Čím viac hlasov jedna stránka má, tým je dôležitejšia, má vyšší PageRank. Nejde však len o počet odkazov smerujúcich na ňu. Záleží aj na tom, aký PageRank a koľko odkazov má stránka, ktorá odkazuje.

Ako sa PageRank počíta?

Algoritmus PageRanku bol popísaný zakladateľmi Googlu – Larry Page (odtiaľ ten názov PageRank = Pageovo hodnotenie) a Sergey Brin, v ich práci: The Anatomy of a Large-Scale Hypertextual Web Search Engine. Pôvodný vzorec vyzerá takto:

PR(Pi) = (1-d) + d.∑ (PR(Pj)/C(Pj))

Novšia verzia je mierne upravená, ale v zásade sa na princípe PageRanku nič nemení:

PR(Pi) = (1-d)/N + d.∑ (PR(Pj)/C(Pj)

  • PR(Pi) – PageRank i-tej stránky
  • d = damping faktor menší ako 1 a väčší ako nula, cca. 0,8-0,9
  • P1, P2,…, Pn sú všetky stránky v indexe a teda N je počet stránok v indexe
  • ∑ = suma pre všetky Pj z M(Pi), kde M(Pi) je množina všetkých stránok odkazujúcich na danú stránku i
  • C(Pj) = počet odkazov na j-tej stránke

Ako je vidieť:

  1. PageRank sa neurčuje pre celý web, ale pre každú stránku zvlášť. Neskôr sa pridali verzie, ktoré počítajú PageRank pre celé domény. Tam sa sleduje, ako medzi sebou odkazujú domény, nie stránky.
  2. PageRank stránky j sa neprenáša na stránku i celý, ale je podelený počtom odkazov na stránke j a ešte znížený o damping faktor d.
  3. PageRank stránky je určený na základe PageRankov stránok odkazujúcich na počítanú stránku.

Pre výpočet PR jednej stránky potrebujeme poznať všetky ostatné PR stránok, ktoré na ňu odkazujú. Preto výsledné PR sa počíta v niekoľkých kolách a prekvapivo, vypočítané hodnoty pomerne rýchlo po niekoľkých iteráciách konvergujú k reálnemu PR (odhaduje sa, že pre priradenie PageRanku celosvetovému webu je potrebných asi 100 iterácií).

Random Surfer Model = Model náhodného browsujúceho

PageRank vychádza z modelu náhodného browsujúceho. Určuje pravdepodobnosť, s akou sa používateľ, ktorý náhodne kliká po odkazoch, dostane na danú stránku X. No a potom pravdepodobnosť, s akou klikne na jeden odkaz vedúci na stránku Y, je 1 lomeno počet odkazov na stránke (1/C(Px)). Čiže PageRank (pravdepodobnosť), ktorý by sa mal presúvať na prekliknutú stránku Y je PR(Px)/C(Px).

Táto hodnota je ešte znížená vynásobením damping faktorom d, kde (1-d) by sa dalo vysvetliť ako pravdepodobnosť, že browsujúci už neklikne na žiadnu ďalšiu stránku a teda, že stránka X bola posledná, ktorú navštívil.

Ak spočítame všetky takéto pravdepodobnosti, dostaneme pravdepodobnosť (PRy), že náhodný browsujúci pristane na stránke Y.

Ako zistiť PageRank web stránky?

Pokiaľ hovoríme o PageRanku web stránky, môžeme myslieť na dve veci – reálny PageRank (real PR) alebo Toolbar PageRank (TBPR alebo GTPR – Google Toolbar PageRank). Reálny PageRank je pravdepodobne dôležitý pre umiestnenie stránok vo výsledkoch hľadania. Lenže táto hodnota sa nedá nijak zistiť, Google túto informáciu nezverejňuje.

Google však do roku 2016 prevádzal reálny PageRank na škálu od 0 do 10 = Toolbar PageRank, ktorú zverejňoval vo svojom Toolbar-i. Reálny PageRank sa prevádzal na toolbarový logaritmicky, čo teda znamenalo, že rozdiel medzi vyššími PR (PR8 vs. PR7) je väčší ako rozdiel medzi nižšími (PR3 vs. PR2).

Dnes vám PageRank odadujú už len tretie strany, napr. rôznymi toolbarmi. Ich výpovedná hodnota je však otázna.

Ako zvýšiť PageRank stránky?

Z uvedeného by to malo byť ihneď jasné, že PageRank sa zvyšuje získavaním spätných odkazov na stránku.