
Crawling je proces, při kterém vyhledávače procházejí web pomocí automatických programů — crawlerů. Indexace je pak krok, kdy Google analyzuje obsah stránky a uloží ji do svého indexu. Stránka, která není zaindexovaná, se ve vyhledávání nezobrazí. Crawling a indexace jsou základní podmínkou viditelnosti.
Jak crawling funguje
Googlebot (crawler Googlu) neustále prochází internet. Začíná na známých stránkách a postupuje přes odkazy na další a další URL adresy.
Když Googlebot navštíví vaši stránku, stáhne si její HTML kód, CSS, JavaScript a další soubory. Pak analyzuje obsah a zjišťuje, o čem stránka je.
Důležité je, že Googlebot neprocházuje všechny stránky stejně často. Weby s vysokou autoritou a častými aktualizacemi navštěvuje denně. Malé weby s řídkými změnami třeba jednou za měsíc.
Kolik stránek Googlebot projde při jedné návštěvě, závisí na takzvaném crawl budgetu – tedy kolik času a prostředků je Google ochotný vašemu webu věnovat.
Jak funguje indexace
Po crawlingu přichází indexace. Google analyzuje obsah stránky – text, obrázky, strukturu nadpisů, meta description a další prvky.
Pokud Google usoudí, že stránka přináší hodnotu, uloží ji do svého indexu. Index je obrovská databáze všech stránek, které Google zná a považuje za hodné zobrazení.
Ale pozor – ne každá procházená stránka se dostane do indexu. Google může stránku vynechat, pokud:
- Obsahuje duplicitní obsah.
- Má nízkou kvalitu nebo žádný unikátní přínos.
- Je zablokovaná v robots.txt nebo má meta tag noindex.
- Má technické problémy (pomalé načítání, chyby serveru).
Proč je crawling a indexace důležitý pro SEO
Bez crawlingu a indexace neexistujete ve vyhledávání. Je to tak prosté. Můžete mít skvělý obsah, perfektní on-page SEO a desítky zpětných odkazů. Ale pokud Google vaši stránku neprojde a nezaindexuje, nikdo ji ve výsledcích neuvidí.
V praxi narážím na weby, které mají stovky stránek, ale v indexu Googlu jich je zlomek. Často kvůli špatné interní struktuře nebo technickým problémům.
Jak zlepšit crawling a indexaci
- Vytvořte sitemapu – XML soubor, který Googlu řekne, jaké stránky na webu máte.
- Správně nastavte robots.txt – nebráníte náhodou Googlu v přístupu k důležitým stránkám?
- Budujte interní odkazy – Googlebot postupuje přes odkazy. Stránka bez odkazů je slepá ulička.
- Zrychlete web – pomalý web znamená méně procházených stránek v rámci crawl budgetu.
- Používejte Google Search Console – sledujte stav indexace a řešte problémy včas.
- Aktualizujte obsah – častější změny motivují Googlebota k častějším návštěvám.
Chcete zjistit, jestli Google správně prochází váš web? Ozvěte se mi a provedeme důkladný SEO audit.
Často kladené otázky
Jak zjistím, jestli je moje stránka zaindexovaná?
Zadejte do Googlu site:vasedomena.cz/stranka/. Pokud se zobrazí, je zaindexovaná. Přesnější informace najdete v Google Search Console v sekci Indexování. Uvidíte, kolik stránek je zaindexovaných a proč některé nejsou.
Jak dlouho trvá, než Google zaindexuje novou stránku?
Od několika hodin po několik týdnů. Záleží na autoritě webu a frekvenci crawlingu. Můžete to urychlit odesláním URL přes Google Search Console (Kontrola URL adresy). U zavedených webů s vysokou autoritou bývá indexace rychlejší.
Co je crawl budget a proč na něm záleží?
Crawl budget určuje, kolik stránek Googlebot projde při jedné návštěvě vašeho webu. U malých webů (do stovek stránek) to většinou není problém. Ale u velkých e-shopů s tisíci produkty může nízký crawl budget znamenat, že Google některé stránky neprojde vůbec.
Zdroje
- Google Search Central — How Google Search Works – Oficiální dokumentace o crawlingu a indexaci
- Google Search Central — Crawl Budget – Jak Google přistupuje ke crawl budgetu u velkých webů
- Ahrefs — Google Index: How to Get Your Website Indexed – Praktický průvodce indexací a řešení běžných problémů