Interné prelinkovanie podľa entít: navádzanie LLM na správny kontext
Prečo entity menia pravidlá interného prelinkovania
Tradičné interné prelinkovanie je zamerané na kľúčové slová a informačnú architektúru pre ľudí. Pre SEO optimalizáciu pre ChatGPT a iné LLM však funguje lepšie entitné prelinkovanie – prepojenie na úrovni pomenovaných entít (osoby, organizácie, produkty, pojmy, normy, lokality) a ich vzťahov. LLM pracujú s reprezentáciou významu (distribučná sémantika), ktorú entitné odkazy uzemňujú do presnejších kontextov. Výsledok: menšia halucinovanosť, menej zámien rovnomených pojmov, vyššia šanca, že model načíta správnu „kanonickú“ stránku pri odpovedi.
Kanonická entita a obsahové uzly: základná typológia
- Entity hub (kanonická stránka entity): primárny uzol pre konkrétnu entitu s definíciou, alternatívnymi názvami, identifikátormi (Wikidata, ORCID, ROR, ISBN, DOI), taxonómiou a FAQ.
- Relation hub (vzťahový uzol): stránka pre vzťah medzi entitami (napr. „Produkt A kompatibilita s Platformou B“), ktorá explicitne modeluje predikát (kompatibilita, závislosť, nadriadenosť).
- Leaf články: špecializované texty orientované na úlohy, prípady použitia alebo otázky, ktoré odkazujú späť na entity hub aj relation hub.
- Proof/zdrojový uzol: stránka zhromažďujúca primárne zdroje pre danú entitu (štúdie, normy) a schémy citácií; slúži LLM ako dôkazový kontext.
Modelovanie entít: mená, aliasy a disambiguácia
LLM potrebujú jasné signály, že dve frázy sú tá istá entita. Preto každý entity hub obsahuje:
- Oficiálny názov a aliasy (vrátane skratiek, preklepov a prekladov).
- Externé identifikátory (schema.org
identifier) a typ entity (schema.org@type). - Rozlišovacie znaky – krátke porovnania proti homonymám (napr. „Java (programovací jazyk)“ vs. „Java (ostrov)“).
Architektúra interného prelinkovania podľa entít
- Kanonická mapa entít: centrálna tabuľka entita → URL (hub) s aliasmi, identifikátormi a stavom (draft/active/deprecated).
- Pravidlá smerovania odkazov: každé prvé zmienenie entity v článku odkazuje na hub; opakované zmienky odkazujú podľa kontextu na relation hub alebo relevantný leaf.
- Breadcrumb + nadradené entity: v hlavičke leaf článkov zobrazujte nadriadené entity (napr. „Kryptografia › AES › GCM režim“).
- Kontextové boxy: pri každej entite krátky „ContextCard“ s definíciou, identifikátormi a odkazmi na overenie (datasety/normy).
Semantické kotvy a atribúty odkazov pre LLM
Odkaz by mal niesť sémantiku entity, nie iba bežný anchor text. Odporúčania:
<a href="/entity/aes" data-entity="AES" data-qid="Q127367" itemprop="mentions" rel="internal">AES (Advanced Encryption Standard)</a>- Anchor text má obsahovať plný názov + skratku pri prvom výskyte; neskôr stačí skratka.
- Ak článok obsahuje viac homonymných entít, použite
aria-labels disambiguáciou (napr.aria-label="Java, programovací jazyk").
Štruktúrované dáta pre entitné prelinkovanie (JSON-LD)
Každý hub i leaf by mal exponovať schema.org s poliami about, mentions, sameAs a citation. Minimálna kostra pre entity hub:
@type: Thing alebo doménovo špecifický typ (napr. Product, MedicalEntity).name,alternateName,identifier(Wikidata/QID, DOI, ORCID, ROR).sameAs: odkazy na autoritatívne záznamy.hasPart/isPartOf: väzby na relation/leaf uzly.
Entitný PageRank a prioritizácia odkazov
Nie všetky entity sú rovnako dôležité. Zaveďte Entitný PageRank (EPR):
- Hodnota entity: autorita (počet kvalitných zdrojov), dopyt (vyhľadávanie/otázky), obchodný význam.
- Váhy odkazov: od hub → leaf nižšia váha, leaf → hub vyššia (kanonizácia), leaf ↔ leaf stredná (laterálne učenie).
- Limitácia odkazov: každý odsek max. 1–2 entitné odkazy; vysoká hustota rozmazáva signál pre LLM.
Relation huby: explicitné predikáty eliminujú halucinácie
LLM si často domýšľajú vzťahy. Preto vzťahy nepopisujte iba v texte, ale budujte relation huby s názvom v tvare Entita A –> Predikát –> Entita B (napr. „AES → režim → GCM“). Stránka obsahuje:
- Definovaný predikát (napr. „je režimom šifrovania pre“).
- Obmedzenia (od kedy platí, v akých verziách, výnimky).
- Vizuálnu schému (diagram) a príklady použitia.
- Citácie na primárne zdroje k vzťahu; tým model dostane jednoznačný dôkazový kontext.
Pravidlá anchor textu a mikrokópie pre LLM
- Kanonizačný anchor: „definícia“, „štandard“, „špecifikácia“ – smeruje na hub.
- Úlohový anchor: „implementácia v praxi“, „konfigurácia“ – smeruje na leaf.
- Vzťahový anchor: „kompatibilita s“, „porovnanie vs.“ – smeruje na relation hub.
- Zdrojový anchor: „primárne štúdie“ – smeruje na proof uzol.
Interné linkovanie a navigačné komponenty
Okrem bežných odkazov použite komponenty s vysokou informatívnosťou pre modely:
- Entity ToC: dynamický zoznam entít, ktoré stránka pokrýva (s
data-entityatribútmi). - ContextCard v bočnom paneli: identifikátory, aliasy, vztahy, top citácie.
- „Related by predicate“ box: prehľad susedných entít podľa konkrétneho predikátu (napr. „alternatívne režimy“).
Proces: od inventarizácie entít po CI validáciu
- Inventarizácia: zozbierajte existujúce entity, URL, aliasy a externé ID.
- Kanonizácia: každá entita dostane hub; duplicitné stránky sa zlúčia a presmerujú.
- Mapovanie vzťahov: určite kľúčové predikáty a založte relation huby.
- Šablóny v CMS: povinné polia: name, alternateName, identifier, sameAs, about/mentions, isPartOf/hasPart.
- CI kontroly: skript, ktorý odmietne publikáciu, ak chýba odkaz na hub pri prvom výskyte entity, alebo chýba
mentionsv JSON-LD.
Entitné breadcrumbs a URL konvencie
Štruktúra URL a breadcrumbs signalizujú hierarchiu pre LLM:
/entity/<kanonicky-nazov>pre hub./entity/<A>/relation/<predikat>/<B>pre relation hub./guides/<tema>pre leaf; v hlavičke breadcrumb s odkazom na hub entity, ktorých sa text týka.
Meranie účinku prelinkovania na LLM
- Attribution@1: podiel odpovedí modelu, kde primárny odkaz smeruje na kanonický hub.
- Disambiguation error rate: miera zámien rovnakých názvov pred vs. po zavedení entitných hubov.
- Grounded answer rate: percento odpovedí s odkazom na hub/relation hub namiesto náhodných stránok.
- Path depth to evidence: počet klikov k primárnym zdrojom; cieľ ≤ 2.
Príklad entitného prelinkovania v texte
„Pri implementácii AES v režime GCM odporúčame overiť kompatibilitu podľa vzťahu režimu a nastavenia nonce.“
Entitné tabuľky a zásobník pre linkovanie
| Entita | Typ | Hub URL | Alias/alternateName | Externé ID | Priorita (EPR) |
|---|---|---|---|---|---|
| AES | CryptographicAlgorithm | /entity/aes | Advanced Encryption Standard | Wikidata:Q127367 | 0.92 |
| GCM | ModeOfOperation | /entity/gcm | Galois/Counter Mode | Wikidata:Q603637 | 0.81 |
| Nonce | SecurityProperty | /entity/nonce | Initialization Vector (IV) | Wikidata:Q219637 | 0.67 |
Kontextové boxy (ContextCard) – špecifikácia komponentu
- Obsah: názov, krátka definícia, aliasy, identifikátory, 3–5 kľúčových vzťahov, odkazy na proof uzly.
- Strojové značky:
data-entity,itemtype,itemprop,sameAs. - Umiestnenie: nad foldom vpravo; sticky pri scrollovaní pre neutrálny opakovaný signál.
Prelinkovanie v častých otázkach (FAQ) a TL;DR
LLM často vyberajú odpovede z FAQ a TL;DR. Preto:
- V každej FAQ položke odkážte kľúčové entity na hub.
- V TL;DR sekcii používajte krátke, ale sémanticky bohaté anchor texty (názvy + skratky).
- Každý odkaz v TL;DR má vyššiu váhu, preto ich počet limitujte na 3–4 najdôležitejšie entity.
On-page disambiguation: keď jedna fráza znamená viac vecí
Ak stránka pokrýva entity s rovnakým názvom:
- Vložte „Rozlíšenie pojmov“ s odkazmi na jednotlivé huby.
- Doplňte
aria-describedbyk odkazom, ktorý vysvetlí, ktorú entitu reprezentujú. - V JSON-LD použite
aboutako pole s viacerými entitami adisambiguatingDescription.
Protip: navigácia podľa predikátov (nie iba podľa tém)
V hornej navigácii alebo v bočnom paneli vyfiltrujte odkazy podľa predikátov: „je kompatibilné s“, „závisí od“, „nahrádza“, „vyžaduje“. Pre LLM sú predikáty kľúčovým mostom na správny kontext.
Revízia a governance entít
- Správa životného cyklu: entita môže byť draft, active, deprecated; pri deprecated presmerujte na nástupníka a označte v JSON-LD.
- Audit odkazov: mesačný report nefunkčných alebo nekanonických odkazov (leaf → leaf bez hubu).
- Kontrola aliasov: nové synonymá pridajte do hubu; CI test upozorní na „neznámy alias“ v anchor texte.
KPI a experimenty
- LLM-clickthrough@hub: miera, s akou modely pri citovaní vyberú hub.
- Answer consistency score: zhodnosť odpovedí modelu naprieč stránkami pokrývajúcimi tú istú entitu.
- Disambiguation latency: koľko tokenov model potrebuje, aby „pochopil“ správnu entitu; cieľ je skrátenie po zavedení entitných odkazov.
Checklist pre vydanie
- Prvé zmienenie každej entity odkazuje na entity hub.
- Vzťahy medzi entitami majú relation hub s definovaným predikátom.
- Všetky entity majú aliasy a externé identifikátory v huboch.
- Leaf stránky majú breadcrumbs vedúce cez hub.
- JSON-LD obsahuje about, mentions, sameAs a odkazy na huby.
Najčastejšie chyby a ich prevencia
- Keyword-first linking: odkaz na generické kľúčové slovo bez entity signálu → nahraďte odkazom na hub s
data-entity. - Hustota odkazov: príliš veľa entít v odseku → zredukujte na kľúčové 1–2.
- Chýbajúce relation huby: LLM domýšľa vzťahy → vytvorte explicitné predikátové stránky.
- Roztrúsené aliasy: alias bez väzby na hub → centralizujte aliasy do hubu a validujte CI nástrojom.
Entitná vrstva ako „kompas“ pre LLM
Interné prelinkovanie podľa entít vytvára pre LLM navigačnú mapu: kanonické huby ukotvia význam, relation huby vyjasnia vzťahy a leafe články poskytnú praktické odpovede. Pri dôslednom použití s JSON-LD, premyslenými anchor textami a kontrolou hustoty odkazov získate robustný kontext, v ktorom modely konzistentne vyberajú správne stránky – a vaše odpovede z ChatGPT budú presnejšie, stabilnejšie a lepšie atribúované.