1. Perfektní web ještě neznamená snadno čitelný web
Velká část majitelů webů i vývojářů má pocit, že když stránka vypadá dobře, rychle se načítá a obsahově je kvalitní, Google ji automaticky správně pochopí. Jenže vyhledávač nehodnotí jen vizuální dojem. Pracuje s HTML zdrojem, vykreslením stránky, interním prolinkováním, serverovou odezvou a signály, které mu pomáhají rozhodnout, co má vůbec stáhnout a co má indexovat. V praxi se tak stává, že web je z pohledu uživatele bezchybný, ale pro Google je „hůř čitelný“ než průměrný konkurent.
Rozdíl mezi zobrazením stránky a pochopením stránky je v technickém SEO zásadní. Google může stránku načíst, ale kvůli JavaScriptu, blokovaným zdrojům, kanonizaci nebo slabým interním odkazům ji nezařadí do indexu tak, jak očekáváte. Search Console pak často ukáže problémy, které nejsou na první pohled vidět: „Crawled – currently not indexed“, „Discovered – currently not indexed“ nebo „Duplicate, Google chose different canonical than user“.
2. Kde Google nejčastěji naráží: indexace, renderování a kanonizace
Nejčastější příčina není „Google web nevidí“, ale Google web vidí jinak, než čekáte. Typickým případem jsou weby postavené na moderním frontendu, kde je obsah generovaný až po načtení JavaScriptu. Pokud je důležitý text, produkt nebo interní odkaz dostupný až po vykreslení skriptem, Google ho může zpracovat se zpožděním nebo vůbec. To je časté u SPA aplikací, ale i u WordPress webů s těžkými buildery a dynamickými bloky.
Velký problém bývá také kanonizace. Pokud má stránka vlastní canonical, ale zároveň interní odkazy vedou na jinou verzi URL, nebo se generuje více variant s parametry, Google může vybrat jinou kanonickou adresu, než byste chtěli. V Search Console to poznáte podle stavu, kdy je URL sice procházená, ale indexovaná je jiná verze. U e-shopů se to děje například u filtrování, sortingu a stránkování. U obsahových webů zase u UTM parametrů, verzí se slash bez slash nebo u jazykových mutací.
Praktický test je jednoduchý: vezměte 10 nejdůležitějších URL a porovnejte URL v prohlížeči, canonical tag, interní odkazy a URL v sitemapě. Pokud se liší více než v drobnostech, máte signálový chaos. Google má rád konzistenci. Jakmile jedna stránka říká „indexuj mě“ a jiná část webu nebo sitemap říká něco jiného, rozhodování se zpomaluje a část stránek končí mimo index.
3. Když je problém v samotném crawl budgetu a serveru
U menších webů se o crawl budgetu mluví často zbytečně, ale u stovek a tisíců URL je to reálný limit. Google nebude donekonečna procházet duplicitní, slabé nebo technicky problematické stránky. Pokud server vrací pomalé odpovědi, chyby 5xx nebo přesměrovací řetězce, crawler začne být opatrnější. V praxi to znamená, že nové nebo aktualizované stránky se dostanou do indexu později, případně vůbec.
Za problematické považujte zejména:
- odezvu serveru nad 500 ms u většího množství URL,
- opakované chyby 5xx v logách,
- dlouhé přesměrovací řetězce typu
A → B → C → D, - zbytečné parametry vytvářející tisíce variant jedné stránky,
- nestabilní hosting nebo časté time-outy při vyšší návštěvnosti.
Nejlepší diagnostika je kombinace Google Search Console, serverových logů a nástroje jako Screaming Frog nebo Sitebulb. V logách sledujte, jak často Googlebot navštěvuje důležité URL, kolik času tráví na duplicitách a zda nenaráží na chyby. U větších webů je velmi užitečné porovnat crawl frequency u kategorií, produktů a blogových článků. Často zjistíte, že Google tráví velkou část kapacity na stránkách, které pro byznys nemají téměř žádnou hodnotu.
4. Obsah může být kvalitní, ale pro Google špatně pochopitelný
Google dnes nečte web jen podle klíčových slov. Vyhodnocuje tematické vztahy, entity, strukturu a kontext. Pokud je stránka napsaná dobře pro člověka, ale chybí jí jasná hierarchie nadpisů, interní vazby a strukturovaná data, může být pro vyhledávač méně srozumitelná, než by měla být. To je časté u webů, které sice mají kvalitní texty, ale jednotlivé články spolu nesouvisejí a nebudují žádný topic cluster.
Typický problém je, že web pokrývá jedno téma z více úhlů, ale bez jasného propojení. Google pak nerozpozná, která stránka je hlavní, která podpůrná a jaký je jejich vztah. Výsledek? Kanibalizace, slabší viditelnost a kolísání pozic. Pokud máte například článek o technickém SEO, měl by být propojený s tématy jako Core Web Vitals, indexace, crawl budget, schema markup a interní prolinkování. Ne izolovaně, ale jako logická síť.
Pomáhá také schema markup. Ne proto, že by sám o sobě „zvedal pozice“, ale protože zpřesňuje význam stránky. U článků použijte Article nebo BlogPosting, u firem Organization, u lokálních webů LocalBusiness, u produktů Product a Offer. Validaci dělejte přes Rich Results Test a Schema Markup Validator. Pokud markup neodpovídá reálnému obsahu, může být ignorován nebo dokonce vytvářet nesoulad mezi viditelným obsahem a daty pro robota.
5. Co zkontrolovat v praxi během 30 minut
Když web „vypadá perfektně“, ale výkon v organiku tomu neodpovídá, začněte rychlým auditem. Většinu problémů odhalíte během půl hodiny, pokud víte, kam se dívat. Doporučený postup:
- Search Console → Kontrola URL: ověřte, zda je stránka indexovatelná, kanonická a zda Google viděl stejný obsah jako uživatel.
- Coverage / Stránky: sledujte stavy „Crawled – currently not indexed“, „Duplicate“, „Blocked by robots.txt“ a „Alternate page with proper canonical tag“.
- PageSpeed Insights + Lighthouse: zkontrolujte LCP, INP, CLS a hlavně skutečný render obsahu.
- Screaming Frog: projděte title, meta robots, canonical, status codes, H1 a vnitřní odkazy.
- „View source“ vs. render: porovnejte HTML zdroj a vykreslenou verzi stránky, zejména u JS webů.
- Log analysis: zjistěte, zda Googlebot vůbec chodí na důležité stránky a zda neplýtvá crawl na zbytečnostech.
U webů na WordPressu bývá častým zdrojem problému kombinace pluginů: SEO plugin nastaví canonical správně, builder přidá další vrstvu HTML, cache plugin servíruje starou verzi a security plugin blokuje část crawlerů. Na první pohled funguje vše, ale Google dostává rozporuplné signály. Proto je důležité po každé větší změně znovu otestovat několik reprezentativních URL, ne jen homepage.
6. Největší přínos má odstranění rozporů, ne kosmetické úpravy
V technickém SEO se často ztrácí čas na drobnostech, které mají malý dopad, zatímco skutečný problém zůstává. Pokud Google web čte špatně, téměř vždy jde o nesoulad mezi tím, co je v HTML, co se vykreslí v prohlížeči, co je v interních odkazech a co posíláte do sitemap. Právě odstranění těchto rozporů mívá největší efekt. U větších webů může správně nastavená kanonizace, sjednocení parametrů a zrychlení serverové odezvy znamenat rozdíl mezi desítkami a stovkami indexovaných URL navíc.
Nejlepší praxe je pracovat se třemi vrstvami zároveň: technika (rychlost, indexace, render), struktura (interní odkazy, sitemap, canonical, schema) a obsahový kontext (téma, entity, záměr vyhledávání). Když jedna vrstva selže, Google si pomůže po svém. A právě tehdy vzniká situace, kdy je web objektivně kvalitní, ale ve vyhledávání se neprosazuje tak, jak by měl.
Pokud chcete začít prakticky, vyberte si 20 nejdůležitějších URL, projděte je v Search Console, porovnejte render a logy a opravte vše, co vytváří nejednotné signály. To je nejrychlejší cesta k tomu, aby Google váš web nejen našel, ale hlavně správně pochopil.
