SEO incident management: runbook a postmortemy
SEO incident management: prečo potrebujeme runbook a postmortemy
Programmatic SEO a automatizácia prinášajú rozsah a rýchlosť, no zároveň zvyšujú riziko chýb s dopadom na organickú návštevnosť a tržby. „SEO incident management“ je disciplína, ktorá spája monitorovanie, procesné riadenie, technickú diagnostiku a kultúru bez obviňovania. Cieľom je rýchlo detegovať incidenty, zamedziť eskalácii, obnoviť stav a z incidentov sa učiť pomocou postmortemov. Tento článok predstavuje praktický runbook, metriky, roly, nástroje a štruktúru postmortemov pre tímy zamerané na meranie, automatizáciu a programmatic SEO.
Definícia SEO incidentu a taxonómia
- SEO incident je neplánovaná zmena alebo udalosť, ktorá negatívne ovplyvňuje indexáciu, viditeľnosť, kvalitu výsledkov alebo organickú výkonnosť.
- Konfiguračné incidenty:
robots.txt,noindex,canonical,hreflang,meta robots, HTTP hlavičky. - Obsahové incidenty: masové prepísanie titulkov, duplicitné templaty, vynechané schémy, chyby v dátach produktov.
- Infrastruktúrne incidenty: 5xx, latencia, CDN/edge misconfig, JS rendering, CSP bloky, chýbajúce fonty/ikonické sady.
- Indexačné incidenty: pokles početnosti indexu, zlyhané sitemapy, chybné odkazy v paginácii, zastavenie „discovery“ pri nových URL.
- Výkonnostné incidenty: náhle zhoršenie Core Web Vitals, „layout shift“ po release, presiaknutie tretích strán (tagy, experimenty).
Kategórie závažnosti a odozva
| Severita | Popis | Max. čas na detekciu | Max. čas na obnovu | Príklady |
|---|---|---|---|---|
| S1 (kritická) | Riziko plošného deindexu alebo významný výpadok crawl/index | 15 min | 2 h (hotfix) | Disallow: / v robots.txt, globálny noindex |
| S2 (vysoká) | Čiastočné dopady, významný pokles kvality alebo indexu | 1 h | 24 h | Zlý canonical na šablóne, hreflang swap |
| S3 (stredná) | Lokálne alebo segmentové problémy | 24 h | 72 h | Chýbajúce schémy, prepad CWV v jednej sekcii |
| S4 (nízka) | Menšie regresie bez okamžitého biznis dopadu | 72 h | Plán release | Nadpisové konvencie, drobné štrukturálne chyby |
Roly, zodpovednosti a komunikačné kanály
- Incident Commander (IC): vedie odozvu, priorizuje kroky, manažuje čas a rozhodnutia.
- SEO Tech Lead: diagnostika signálov pre indexáciu, rendering a linkovanie.
- Release Engineer: rollback/rollforward, feature flagy, hotfix pipeline.
- Data Steward: kvalita feedov, sitemáp, schém, monitor „data freshness“.
- Comms Owner: interné a stakeholder updaty, status page, zákaznícka komunikácia, ak je potrebná.
Monitorovanie: metriky pre včasnú detekciu
- Crawl a index: pomer 2xx/4xx/5xx, počet prehľadaných a indexovaných URL, čas odozvy crawler path, počet validných vs. vylúčených stránok.
- Sitemapy: dostupnosť, počet URL, percento „lastmod“ zmien, korelácia s novými URL vo feede.
- Render: rozdiel textového DOM vs. prerender DOM (critical content parity), JS error rate.
- Meta signály: masové zmeny v
meta robots,canonicaldivergencii, hreflang validácia,alternatelinky. - Výkon: LCP, INP, CLS podľa šablón a segmentov, percentil 75.
- Linky a navigácia: straty interných odkazov, broken nav, paginácia (rel prev/next náhrady, page parametre).
- Biznis: organická návštevnosť a konverzie po „seasonality-adjusted“ baseline (CUPED).
Alerting: prahy, korelácie a „noise suppression“
- Prahy: definujte percentuálne a absolútne zmeny (napr. 5xx ≥ 2 % počas 10 min, pokles indexu ≥ 5 % dňa).
- Korelácie: spúšťajte kompozitné alerty (napr. 5xx spike + pokles crawl rate + nárast „Submitted URL marked ‘noindex’“).
- Potláčanie šumu: time-window a deň v týždni, oddelenie release okna a sviatkov.
- Routing alertov: S1 priamo na pager IC a Release; S2 do incident roomu; S3 do backlog kanálu.
Runbook: princípy a štruktúra
- Jasná rozhodovacia stromovitosť pre typy incidentov (konfigurácia, infra, obsah, dáta).
- Predpripravené úkony: overenie prístupov, skripty na dify
robots.txt, export kanonických URL, hreflang audit, sitemap validator. - Bezpečný rollback: definované verzie, automatické testy kompatibility, feature flagy a kill switch.
- Verifikácia: checklist po zásahu (kontrola parity DOM, statusy, indexačné signály, CWV regresné testy).
Prvých 15 minút incidentu
- Declare: priraď severitu, otvoriť incident kanál, IC berie velenie.
- Freeze: pozastaviť releasy a experimenty v dotknutej oblasti.
- Stabilizácia: ak hrozí plošný dopad, okamžitý rollback alebo aktivácia flagu.
- Rýchla diagnostika: triage cez dashboardy (crawl/index/render/perf/biznis), zber quick difov.
- Komunikácia: krátky status pre stakeholderov (čo vieme, čo robíme, ďalší update kedy).
Diagnostika: rozhodovací strom
- Plošný prepad indexu: skontrolovať
robots.txt,X-Robots-Tag, globálne templaty meta, canonical na root/doménu, 5xx. - Degradácia renderu: zmeny v bundli, CSP, lazy-hydration; porovnať prerender snapshot vs. live DOM.
- Sitemapy: HTTP kódy, veľkosť,
lastmod, korelácia s početnosťou nových URL, index coverage. - Hreflang: duplicity, neexistujúce
return tags, prehodené jazykové kódy, regionálne konflikty. - Interné linky: strata sekcií v nav/footri, zmenené slugs, neaktualizované redirect mapy.
Remediácia: bezpečné zásahy a kontrolované zmeny
- Rollback do poslednej stabilnej verzie, ak nie je známa príčina alebo riziko eskalácie je vysoké.
- Hotfix s úzkym scope a peer review; zákaz „jazdy na slepo“ cez ďalšie releasy.
- Feature flags: vypnutie problematických šablón/sekcií bez redeploye celku.
- Edge rules: dočasná úprava hlavičiek/cachingu/redirectov na CDN pre zmiernenie dopadov.
Verifikácia po zásahu
- Technická kontrola: 2xx/4xx/5xx pomery, response times, DOM parity, JS error rate.
- Indexačné signály: sampling fetch, kontrola meta/hlavičiek, sitemap validácia, canonical konzistencia.
- Výkonnostné metriky: LCP/INP/CLS na dotknutých šablónach.
- Biznis: čiastočná obnova návštevnosti/konverzií vs. baseline.
Šablóna komunikačných správ
- Initial: „Detegovali sme SEO incident S2 ovplyvňujúci sekciu Kategórie. Prebieha rollback, ďalší update o 30 min.“
- Ongoing: „Rollback nasadený, validujeme sitemapy a canonical. Predbežný dôvod: zmena šablóny bez aktualizácie redirect mapy.“
- Resolved: „Incident vyriešený, metriky sa vracajú k baseline. Nasleduje postmortem do 72 hodín.“
Runbook pre najčastejšie incidenty
- Robots.txt Disallow
- Krok 1: okamžitá kontrola verzie v repozitári a na edge; ak zmena, rollback.
- Krok 2: invalidácia CDN cache pre
/robots.txt. - Krok 3: verifikácia cez viac PoP a cez sampling fetch.
- Krok 4: postmortem k príčine generovania súboru (templata, pipeline, cron).
- Globálny noindex
- Krok 1: vypnúť flag/šablónu, ktorá injektuje
noindexalebo hlavičkuX-Robots-Tag. - Krok 2: overiť na reprezentatívnom vzorku a v kritických sekciách.
- Krok 3: sledovať reindex trend, posilniť interné linky na kľúčové vstupy.
- Krok 1: vypnúť flag/šablónu, ktorá injektuje
- Chybný canonical
- Krok 1: export divergence (self vs. not-self), identifikácia šablón.
- Krok 2: hotfix na templatu, re-release s testami na canonical konzistenciu.
- Krok 3: kontrola kanibalizácie a mapovanie redirectov.
- Hreflang rozpad
- Krok 1: validovať reciprocity a regionálne kódy.
- Krok 2: revert posledných i18n zmien, opraviť feedy a alternates.
- Krok 3: sampling výsledkov podľa krajín a jazykov.
- 5xx/latencia spike
- Krok 1: škálovať infra, znížiť TTL, presmerovať traffic, dočasne vypnúť ťažké skripty.
- Krok 2: chrániť crawl budget cez
Retry-Aftera robots hinting pre problematické sekcie.
Automatizácia a „config as code“
- Policy guardy: testy, ktoré zakážu release s
noindexmimo dev/stage. - Schémové testy: validátor pre
Product,Article,FAQPagepred nasadením. - Link budget control: testy na minimálnu hustotu interných odkazov v navigácii.
- Sitemapa ako artefakt: generovaná v CI s kontrolou počtu URL, checksum a
lastmod. - Flagy: centrálne spravované s audit logom a owners.
Meranie dopadov a cieľové úrovne služieb
- SLO pre indexáciu: „≥ 98 % kritických URL musí byť indexovateľných (bez blokujúcich signálov).“
- SLO pre render: „Parita prerender vs. live DOM ≥ 95 % kľúčových elementov.“
- Error budget: mesačný limit incidentov S1/S2; pri vyčerpaní pauza v rozširovaní funkcionalít.
Postmortem: zásady a štruktúra
- Bez obviňovania: cieľ je zlepšiť systém, nie nájsť vinníka.
- Časovanie: S1 do 72 h, S2 do 5 pracovných dní.
- Obsah:
- Prehľad: názov, dátumy, severita, dopad na metriky.
- Timeline: detekcia → rozhodnutia → zásahy → verifikácia.
- RCA: 5-Whys, príčiny a prispievajúce faktory (technické, procesné, ľudské).
- Obmedzenia: prečo zlyhali guardy/monitoring.
- Actions: konkrétne úlohy s vlastníkmi a dátumami (preventívne, detekčné, remediačné).
- Učenia: čo prenášame do štandardov, šablón a testov.
Príklad akčných bodov po postmorteme
- Pridať unit test: zákaz
noindexv produkčnom build profile. - Rozšíriť monitoring: alert na zmenu veľkosti
sitemap.xmlo ±10 % v priebehu 24 h. - Zaviesť dvojitý sign-off pre úpravy
robots.txta canonical logiku. - Vytvoriť „canary“ sekciu s nízkou váhou trafficu pre skorú detekciu regresií.
Tréning, cvičenia a simulácie
- Game days: riadené simulácie incidentov (falošný
Disallow: /, rozbitá sitemapa). - Runbook drilly: overenie, že každý člen vie spustiť audit a rollback.
- On-call rotácia: zdieľaná zodpovednosť a znalosti medzi SEO, vývojom a infra.
Riadenie závislostí a third-party rizík
- Tag manažér: verzovanie a schvaľovanie, sandbox pre experimenty.
- CDN a edge funkcie: zmeny iba cez review flow, audit trail, rýchly revert.
- Schémové feedy: validácia konzistencie (počet, povinné polia, jednotky), monitoring „freshness age“.
Vizualizácia a reporting
- Incident dashboard: otvorené incidenty, severita, čas do detekcie/obnovy, trend.
- Mapa dopadov: heatmapa podľa šablón/sekcií/domén.
- Časová os releasov vs. metriky: korelácia udalostí s poklesmi/píkmi.
Governance a životný cyklus dokumentácie
- Runbook ako živý dokument: revízia po každom postmorteme, verzovanie.
- Šablóny postmortemov a checklistov: centrálne, prístupné, s príkladmi.
- Meranie zrelosti: skóre pripravenosti (coverage monitoringu, testov, flagov, cvičení).
Checklist pripravenosti na incident
- Jasné definície severít a eskalačných ciest?
- Dashboardy a alerty pokrývajú crawl, index, render, výkonnosť a biznis?
- Fungujú rollbacks, feature flags a canary releasy?
- Existuje „freeze“ procedúra a komunikačný plán?
- Runbooky pre top 5 incidentov sú aktuálne a testované?
- Postmortem šablóna, termíny a ownership sú dohodnuté?
Dobrý „SEO incident management“ nie je len súbor technických trikov, ale systém prevencie, včasnej detekcie, organizovanej odozvy a učenia. Runbook skracuje čas do obnovy, postmortemy zvyšujú odolnosť a kultúra bez obviňovania buduje dôveru medzi SEO, vývojom a biznisom. V prostredí merania, automatizácie a programmatic SEO ide o strategickú výhodu, ktorá chráni organický kanál a umožňuje rásť bez strachu z paralýzy zmenami.