Hlavní obsah
Internet a technologie

Velký únik dokumentů Google – co to znamená pro SEO?

Médium.cz je otevřená blogovací platforma, kde mohou lidé svobodně publikovat své texty. Nejde o postoje Seznam.cz ani žádné z jeho redakcí.

Foto: shh.agency

Nejvýznamnější únik informací o fungování vyhledávání v Googlu za posledních 15 let a co to znamená pro optimalizaci pro vyhledávače.

Článek

Na internetu zuří 🔥 kvůli uniklým interním dokumentům Google. Materiály potvrzují to, čemu jsme vždy věřili: originální, užitečný obsah dlouhodobě vítězí nad „copy-paste“.

Jakýsi „Erfan Azimi“ najednou začal šířit uniklé dokumenty, obsahující informace o tom, jak funguje řazení ve vyhledávači Google (ve skutečnosti je to trochu složitější, ne samotné vyhledávání, ale různá API kolem něj).

K úniku došlo omylem, jeden z vývojářů Googlu si napsal program, který API převádí na volání (tzv. call) v jiném programovacím jazyce, ale místo veřejných volání je všechny zveřejnil (pokud vás to zajímá, zde je odkaz na commit, který všechny tyto popisy obsahuje).

Podle četných ověření různými bývalými i současnými pracovníky Googlu se nejedná o fake ani o vtip, ale o zcela reálný únik, jehož výzkum nyní všechny výzkumníky SEO velmi znepokojuje.

To, jak Google hodnotí obsah, je černá skříňka: webové stránky jsou závislé na návštěvnosti z vyhledávání, aby přežily, a mnohé z nich vynaloží velké úsilí (a samozřejmě 💰) aby porazily konkurenci a dostaly se na vrchol výsledků v Google. Lepší umístění znamená větší návštěvnost webu, což znamená více peněz.

Tiskoví mluvčí společnosti Google v průběhu let opakovaně popírali, že by se do hodnocení webových stránek promítala například kliknutí uživatelů. V uniklých dokumentech je však uvedeno několik typů kliknutí uživatelů, které se promítají do hodnocení stránek ve vyhledávání. Svědectví z antimonopolní žaloby amerického ministerstva spravedlnosti již dříve odhalilo faktor řazení nazvaný Navboost, který využívá kliknutí uživatelů k vyzdvižení obsahu ve vyhledávání.

Nebudu se v dokumentu příliš podrobně zabývat jednotlivými faktory hodnocení. Je jich hodně.

Ale zde jsou některé, které považuji za obzvláště 🚨 a důležité.

Hlavní poznatky z úniku interních dokumentů Google

  1. Google zařadil weby, které jsou "násilně" optimalizovány, na bílou listinu. Alespoň je to znát u některých témat, jako jsou státní volby v roce 2020, cestování a COVID-19. Odkazy na několika místech na tzv. flagy "isCovidLocalAuthority" a "isElectionAuthority" naznačují, že Google vytváří bílou listinu konkrétních domén, které je vhodné zobrazovat u velmi kontroverzních a potenciálně problematických dotazů.
  2. Název domény i subdomény jsou relevantní informace (Google vždy tvrdil, že ne).
  3. Pro nové weby existuje tzv. pískoviště (ang. sandbox). Co je sandbox? Jednoduše řečeno, je to filtr v algoritmu Google, který dočasně snižuje pozice čerstvě přidaných webů ve výsledcích vyhledávání. Google to vždy popíral.
  4. Vyhledávání přímo využívá data z EWOK (systém, kde sedí živí lidé a za peníze vyhodnocují, která varianta výsledků vyhledávání je lepší). Ano, existují uživatelé, kteří na vlastní oči a názory určují, který z webů je pro konkrétní dotaz lepší. Fascinuje mě, že hodnocení a data generovaná hodnotiteli EWOK mohou být přímo zapojena do vyhledávacího systému Google, a nikoli pouze jako tréninková sada pro experimenty.
  5. Několik modulů v dokumentaci odkazuje na funkce jako „goodClicks“, „badClicks“, „lastLongestClicks“, impressions, squashed, unsquashed a unicorn clicks. NavBoost se téměř výhradně skládá z údajů o kliknutí, jako je nejdelší kliknutí ze SERP (výsledek vyhledávání, na kterém uživatel strávil nejdelší dobu) a poslední dobré kliknutí (naposledy, když někdo přišel na váš web a zůstal na něm). Google má způsoby, jak odfiltrovat kliknutí, která nechce započítat do svých systémů hodnocení, a zahrnout ta, která započítat chce. Měří také délku kliknutí (tj. pogo-sticking - když vyhledávač klikne na výsledek a pak rychle klikne na tlačítko zpět, protože není spokojen s nalezenou odpovědí) a zobrazení. Prokliky sleduje po dobu 13 měsíců.
  6. Google aktivně využívá informace o chování uživatelů na webu pro účely řazení. Obsah a odkazy se tedy stávají sekundární, mnohem důležitější je nyní kliknutí a navigace na webu (to, čemu se říká "behaviorální faktor").
  7. Google sleduje návštěvy nejen přes Google Analytics, ale taky prostřednictvím prohlížeče Chrome napříč webem, aby zjistila chování uživatelů.
  8. Google má skóre autority stránek siteAuthority. Podle počtu kliknutí na stránku jsou weby rozděleny do tří kategorií, pro každou z nich je sestaven jiný "quality rank". Weby, které jsou z hlediska počtu kliknutí populárnější, více přispívají k pageranku (ang. hodnocení stránky), tj. jsou hodnotnější.
  9. Google zohledňuje brand, a to nejen na webu samotném, ale také obecně na zmínkách o tomto webu na internetu (i bez odkazů).
  10. Google ukládá nejméně 20 posledních verzí vašich webových stránek. Chcete-li tedy mít "čistý štít", musíte je pravděpodobně aktualizovat více než 20krát. Není jasné, jak významná změna by musela být na stránce provedena, aby se počítala jako nová verze.
  11. Velikost písma u odkazů a váha textu jsou atributy, které Google sleduje. Mít větší odkazy se jeví pozitivněji a zdá se, že Google čte tučný text jinak než normální text (je to také lepší pro přístupnost!).
  12. Google má skóre tapetování klíčových slov (vysoký poměr počtu klíčových slov k délce textu na jedné stránce).
  13. Pokud má web více než 50 % stránek s videem, bude klasifikován jako web s videem. Není jasné, zda tato videa musí být indexována, zda se musí nacházet v určité oblasti příspěvků, nebo zda musí být nativně nahrána na webové stránky.
  14. Existuje atribut „zlatý standard“, který zřejmě vymezuje obsah generovaný člověkem, ale není jasné, jak se spouští.

Zásadní poznatky pro marketéry, kterým záleží na návštěvnosti z organického vyhledávání

Značka je důležitější než cokoli jiného

Google má mnoho způsobů, jak identifikovat entity, třídit je, hodnotit, filtrovat a uplatňovat. Mezi entity patří brandy neboli značky (názvy značek, jejich oficiální webové stránky, přidružené účty na sociálních sítích atd.), což znamená, že řadí a posílá návštěvnost výhradně velkým, 💪 značkám, které dominují webu spíše než malým, nezávislým webům a firmám. Z toho vyplývá, že pro většinu malých firem a webových stránek je SEO téměř irelevantní, dokud si nevybudujete značku, uživatele na webu a reputaci u publika.

Obsah a odkazy jsou sekundární, pokud je záměr uživatele pouze „navigační“.

Řekněme například, že mnoho lidí v Praze hledá slovo „Hamlet představení“ a ve výsledcích vyhledávání se posouvají na stranu 2, 3 nebo 4, dokud nenajdou nabídku divadelního představení Hamlet, a pak na tento výsledek kliknou. Poměrně rychle se Google naučí, že to je to, co lidé v této oblasti hledají. A mimochodem, tomu se říká „navigační záměr vyhledávání“ 👈.

Pokud dokážete vytvořit poptávku po svých webových stránkách mezi dostatečným počtem lidí ve svém regionu, možná se vám podaří obejít potřebu klasických signálů SEO na stránce i mimo ni, jako jsou odkazy, anchor text, optimalizovaný obsah a podobně. Síla Navboostu a záměr uživatelů je pravděpodobně nejsilnějším faktorem hodnocení v systémech Google.

Klasické faktory hodnocení PageRank, kotvy (tematický PageRank založený na anchor textu odkazu) a textová shoda již několik let ztrácejí na významu. Názvy stránek jsou však stále poměrně důležité.

Zdá se, že PageRank má stále své místo v indexování a řazení ve vyhledávání, ale téměř jistě se od původního dokumentu z roku 1998 vyvinul. Únik dokumentu naznačuje, že v průběhu let bylo vytvořeno a vyřazeno několik verzí PageRanku. A odkazy s anchor textem, ačkoli jsou v úniku přítomny, se nezdají být tak zásadní nebo všudypřítomné, jak bych očekával z dřívějších let v SEO 🤷.

Pro většinu malých a středních podniků a novějších tvůrců/vydavatelů bude SEO pravděpodobně vykazovat nízkou návratnost, dokud si nevytvoříte důvěryhodnost, „navigační poptávku“ a silnou reputaci mezi dostatečně velkým publikem.

Obsah, který vytvoříte, pravděpodobně nebude mít v Googlu dobré výsledky, pokud existuje konkurence velkých, populárních webů od známých značek a velkých hráčů. Google již neodměňuje vychytralé, mazané a v SEO zběhlé odborníky, kteří znají všechny správné triky. Odměňuje zavedené značky, popularitu měřitelnou ve vyhledávání a zavedené domény, které již vyhledávače znají a na které klikají. Dříve bylo možné pomocí SEO pro Google nastartovat výkonný marketingový setrvačník. V roce 2024 to není reálné, alespoň ne v konkurenčních odvětvích 👎.

Kdybych měl dát marketérům, kteří se snaží zlepšit své pozice a návštěvnost v organickém vyhledávání, jednu univerzální radu, byla by to tato:

Vybudujte si ve svém oboru významnou, populární a dobře známou značku mimo vyhledávání Google.

Nevím, co teď chystáte s těmi informacemi dělat, já je jdu zahrnout do svého SEO kurzu punkový digitál.

Máte na tohle téma jiný názor? Napište o něm vlastní článek.

Texty jsou tvořeny uživateli a nepodléhají procesu korektury. Pokud najdete chybu nebo nepřesnost, prosíme, pošlete nám ji na medium.chyby@firma.seznam.cz.

Související témata:

Sdílejte s lidmi své příběhy

Stačí mít účet na Seznamu a můžete začít psát. Ty nejlepší články se mohou zobrazit i na hlavní stránce Seznam.cz

Doporučované

Načítám