Duplicitný obsah má dve roviny. Jednak sa môžeme baviť o duplicitnom obsahu na úrovni celých stránok alebo na úrovni blokov (kusov textu) a inak o duplikátoch v rámci jedného webu alebo o duplikátoch medzi webmi.

Je asi jasné, že duplicita na úrovni stránok je omnoho škodlivejšia ako bloková. Bloková duplicita je dokonca v určitej miere prirodzená, stáva sa veľmi často a legitímne, že stránka cituje inú.

Malo by byť rovnako jasné, že duplicita v rámci webu je väčšinou menší problém ako duplicita medzi rôznymi webmi. Dôvod je zrejmý… duplicita v rámci webu sa stáva aj “náhodou” a aspoň je ako originál označený text autora, kdežto duplikáty medzi stránkami sa náhodou nestávajú a môžu ukradnúť webu autorstvo.

Čo je a čo nie je duplicitným obsahom?

Duplicitným obsahom je aj to, ak skopírujete len jednu dlhšiu vetu, i keď vás to nijak nepoškodí. Duplicitným obsahom však nie je, ak preložíte 8 áštvoriek anglického textu do slovenčiny. Zdá sa vám to divné?

Vyhľadávač nie je matka Tereza a nemôže, alebo skôr nechce/nepotrebuje postihovať plagiátorov-prekladateľov. Pre vyhľadávač je prvoradé, aby dodal hľadajúcemu to, čo hľadá. A z tohto pohľadu je preklad veľmi užitočný pre používateľov, ktorí neovládajú cudzí jazyk.

Púhe prepísanie textu nestačí!

Ak si myslíte, že môžete úspešne kopírovať texty (veď stačí prepísať pár slov v texte), mýlite sa. Vyhľadávače rozpoznávajú aj tzv. near duplicates (podobné stránky = skoro-duplicitné). Ak by ste chceli text prepísať na nerozoznanie od originálu, môžete napísať rovno vlastný.

Priama penalizácia webu kvôli duplicite neexistuje!

Ono totiž existovať nemusí. Stačí, ak vyhľadávač zobrazí vo výsledkoch hľadania len originál. Google na to má svoj vlastný nástroj – supplemental index (i keď už vlastne ako zvláštny index nefunguje, stále sú podradné stránky istým spôsobom označované). Ak Google nájde obsah, ktorý už vo svojom indexe má a má ho na dôveryhodnejšej stránke, pošle “nový objav” do supplementalu. Nový objav potom nevyskakuje vo výsledkoch hľadania.

Takže Google vôbec nepostihuje tých, čo kopírujú obsah? Ale áno, trest za kopírovanie obsahu je ten, že sa neobjavia vo výsledkoch hlavného hľadania, ergo ich snaha vyšla nazmar. Je to jeden z dôvodov, prečo nie som za hosťovské príspevky na blogoch, ktoré už boli uverejnené niekde inde. Jeden z nich (v horšom prípade autor, v lepšom prepisovateľ) ťahá za kratší (supplementalový) koniec. Sú tu predsa iné možnosti ako upozorniť na dobrý článok! (viď Pikiho celulózový spôsob s pridaným vlastným komentárom).

Ako určí vyhľadávač originál?

Myslíte si, že ten, čo uverejnil článok prvý je originál? Vo veľa prípadoch to tak bude, ale kvôli rôznym frekvenciám indexovania webov Google nemusí uložiť do svojho indexu originál ako prvý. Okrem toho sú prípady, kedy sa originál uverejní neskôr ako jeho kópia. Preto Google nemá inú možnosť (vyznieva to, akoby tento spôsob nebol dostačujúci, ale nie je to tak myslené ;)) len použiť faktory ako TrustRank v posúdení toho, kto bude v hlavnom indexe a kto vo vedľajšom.

Ak má niekoľko kópií v indexe vysoký Trust Rank (napr. preberanie článkov TASR rôznymi spravodajskými portálmi – Sme, Pravda, Hospodárske noviny, apod.), Google zobrazí v hlavnom indexe všetky a nechá na používateľovi, od koho si informáciu prečíta. “Originálov je v tomto prípade niekoľko.”

Na záver jeden nástroj na kontrolu duplicít medzi webmi

Pomocou Copyscape zistíte napríklad, že niekto, kto ponúka SEO služby, skopíruje vašu definíciu SEO a pridá: A to poskytujeme. :)))

Skopírovaná definícia SEO

Alebo, že niekto skopíruje vás článok o SEO, pridá ho do tutoriálov a podpíše vlastným webom.

Copyscape

Skopírovaný text podpísaný ako webyseo.sk

PS: Malá rada, ako obísť duplicitu

Piki v komentároch k tomuto článku poradil, ako sa dá problém duplicity pri (dúfam, legálnom) preberaní článkov obísť. Je to veľmi jednoduché, ale účinné len u navštevovanejších stránok: Nechajte ľudí článok komentovať, vytvoria vám v okolí článku dostatok ďalších informácií, aby Google považoval stránku za hodnú hlavného indexu.

Komentáre

  • tybi-admin

    29.05.2008 11:36

    “Chcelo by to nejakú fintu fň.”

    Finta fň za istých okolností existuje. Hint je priamo v článku, konkrétne táto veta: Duplicita na úrovni stránok je omnoho škodlivejšia ako bloková.

    Otázka, ktorá sa priam tisne do úst… Ako urobiť z duplicity na úrovni stránok duplicitu blokovú?

    Správna odpoveď získava odkaz na svoj blog. ;)

    Odpovedať
  • Piki

    29.05.2008 11:45

    Odhadujem, že to je zmeniť podiel duplicitného textu na celkovom texte daného URL pri porovnaní s originálnym url. Prosto tam čosi dopísať. Ručne či automatom.

    Odpovedať
  • tybi-admin

    29.05.2008 12:32

    Presne tak… signifikantne zvýšiť podiel originálneho textu.

    Lenže ručne je to veľa roboty, z toho tá otázka na fintu fň vznikla. A automatické riešenie je len málo spoľahlivé, respektíve aspoň polospoľahlivé riešenie vyžaduje viac práce ako ručné dopisovanie.

    Ako sa dá zvýšiť podiel originálneho textu bez námahy? ;)

    Odpovedať
  • Piki

    29.05.2008 13:33

    Nechám pracovať ľud :-) Komentáre a podobne, napríklad.

    Odpovedať
  • Roman

    29.05.2008 13:43

    nechas tvorit obsah ludmi… (komentujte, hodnotte, piste recenzie, bla bla bla..)

    Odpovedať
  • Roman

    29.05.2008 13:43

    S krizom po funuse ;-))

    Odpovedať
  • tybi-admin

    29.05.2008 13:56

  • Andy

    29.05.2008 14:13

    Hehehe, záver je pekný : )

    Odpovedať
  • Recepty

    23.11.2011 9:24

    pekne finty, hlavne ze pripojit blog ;-)

    Odpovedať

Pridaj komentár

Vaša e-mailová adresa nebude zverejnená. Vyžadované polia sú označené *