8 Min. Lesedauer

KI-Einfluss

Die Ansicht KI-Einfluss zeigt, wie KI-Oberflächen mit Ihrer Website interagieren. Sie deckt zwei Dinge ab, die Sie heute tatsächlich messen können:

KI-Crawler-Zugriff — welche von 29 verfolgten KI-Bots Ihre robots.txt-, llms.txt- und Content-Signal-Deklarationen erlauben oder blockieren.
KI-Referrals — welche KI-Produkte Ihnen menschliche Besucher senden (ChatGPT, Claude, Perplexity, Gemini, Copilot, DeepSeek und 20+ weitere).

Diese werden über drei Registerkarten dargestellt: Übersicht (Posture-Zusammenfassung + robots/Signals-Inspektion), Crawler (die vollständige schreibgeschützte Katalog-Tabelle) und Metriken (KI-Referral-Analytics).

Zwei weitere Ebenen — Citation (wo Ihre Marke in KI-Antworten erscheint) und Assist (probabilistischer Uplift in markenbezogener Suche nach KI-Exposition) — wurden auf V2 vertagt, weil sie entweder einen Anbieter oder risikobewusste probabilistische Modellierung erfordern. Wir liefern keine Vanity-Metriken, die wir nicht rigoros messen können.

Sie finden KI-Einfluss unter Intelligence → KI-Einfluss im Dashboard.

KI-Einfluss ist in jedem Plan verfügbar, inkl. Free. Sichtbarkeit von KI-Traffic ist ein Basis-Akquise-Signal — kein kostenpflichtiges Feature.

KI als Umsatzkanal. Diese Seite zeigt KI-Traffic. Wenn ein als KI identifizierter Besucher konvertiert, wird diese Conversion auch einem erstklassigen AI-Kanal in Revenue → Attribution zugeschrieben, mit derselben Aufschlüsselung pro Produkt — plus einem Likely AI (unspecified)-Bucket für heuristisch erkannte Besuche, die ohne Referrer ankommen. Nutzen Sie diese Seite für Traffic; nutzen Sie die Revenue-Attribution für Conversions. (Die Revenue-Attribution wird im authentifizierten Dashboard angezeigt, nicht auf öffentlichen oder geteilten Dashboards.)

Registerkarte Übersicht

Die Übersicht beantwortet eine Frage auf einen Blick:

"Kann ChatGPT (oder Claude, oder Perplexity, …) meine Website crawlen? Habe ich versehentlich etwas blockiert?"

Sie zeigt eine kompakte Zusammenfassung (wie viele der 29 verfolgten Bots Sie crawlen können, wie viele am Root blockiert sind, menschliche KI-Besuche) und eine Karte Robots & Signals, die das Urteil überprüfbar macht — direkte "Rohdaten anzeigen"-Links zu Ihrer robots.txt und llms.txt, die geparste Content-Signal-Deklaration und die explizite Liste der am Root blockierten Bots.

Content-Signal

Zenovay parst die Content-Signal-Direktive, die Cloudflares "Managed robots.txt" und eine wachsende Zahl von Websites nun ausgeben. Sie drückt die KI-Nutzungs-Absicht unabhängig vom Crawl-Zugriff aus:

search — darf Ihr Inhalt zum Aufbau eines Suchindex verwendet werden?
ai-input — darf er als Echtzeit-Input für eine generative Antwort verwendet werden (RAG/Grounding)?
ai-train — darf er zum Trainieren oder Fine-Tunen eines Modells verwendet werden?

Jedes wird als yes, no oder unset angezeigt. Dies ist die moderne, inhaltsspezifische KI-Consent-Deklaration — abgegrenzt von einem pauschalen Disallow.

Registerkarte Crawler

Eine schreibgeschützte Tabelle aller 29 verfolgten KI-Crawler mit dem konfigurierten Zugriff jedes Bots auf Ihrer Website. Sie ist bewusst kein Kontrollpanel — Zenovay liest robots.txt; es setzt Blocks nicht am Edge durch. Es berichtet, was Ihre robots.txt deklariert.

Die 29 Bots sind in 5 Kategorien gruppiert:

Live-KI-Assistenten — rufen Seiten auf Anfrage ab, um Benutzerfragen zu beantworten: ChatGPT-User, Perplexity-User, ClaudeBot, Bingbot (Copilot), Applebot-Extended.
Modell-Training — sammeln Inhalte für Trainings-Korpora: GPTBot, Google-Extended, anthropic-ai, Common Crawl (CCBot), Meta-ExternalAgent, Bytespider, Amazonbot.
KI-Browser-Agenten — autonome Aufgaben-Agenten, die im Namen eines Benutzers browsen: ChatGPT-Operator, Claude-Computer-Use, You.com Agent.
Kommerzielle Scraper — Data-Mining-Feeds, die an KI-Labs verkauft werden: DataForSEO Bot, PetalBot, Webz.io.
Suche mit KI-Overlays — primäre Such-Indizes, deren Ergebnisse KI-Antworten antreiben: Googlebot (AI Overviews).

Was das Urteil bedeutet

Für ein KI-Content-Zugriffs-Tool ist die einzige relevante Frage "Kann dieser Bot meinen Inhalt erreichen?". Das Urteil wird daher in drei Zuständen berichtet:

Erlaubt — der Bot ist an Ihrem Site-Root zugelassen. Dies schließt Bots ein, die am Root zugelassen, aber von generischen Infrastruktur-Pfaden (/api, /_next, /e, …) ausgeschlossen sind — diese Ausschlüsse werden als Bildunterschrift angezeigt, nicht als Alarm, weil sie den Inhalt nicht einschränken.
Blockiert — der Bot ist am Site-Root durch robots.txt verboten.
Unbekannt — wir konnten Ihre robots.txt nicht lesen (Netzwerkfehler, 5xx, fehlerhaft) oder die Site hatte ihre erste Prüfung noch nicht (neue Sites werden innerhalb von 24 Stunden geprüft).

RFC-9309-Gruppen-Kombination (wichtig, wenn Sie Cloudflare Managed robots.txt verwenden)

Wir folgen RFC 9309. UA-Tokens werden case-insensitive als Substrings abgeglichen (sodass ClaudeBot auf Anthropic-ClaudeBot matcht). Entscheidend: alle User-agent-Gruppen, die auf einen Bot matchen, werden kombiniert, dann wird Longest-Match-Präzedenz angewendet, wobei Allow Gleichstände gewinnt.

Das ist wichtig, weil Cloudflares Managed robots.txt einen verwalteten Block ausgibt, der viele KI-Bots per Disallow: / sperrt, und Site-Betreiber häufig eine spätere benutzerdefinierte Gruppe hinzufügen, die die für KI-Sichtbarkeit gewünschten Bots wieder per Allow: / zulässt. Ein naiver First-Match-Parser würde diese wieder zugelassenen Bots fälschlich als Blockiert melden. Zenovay kombiniert die Gruppen und meldet den effektiven Zugriff des Bots — passend zu dem, was ein konformer Crawler tatsächlich tut.

Der Button "Jetzt neu prüfen"

Der Header enthält einen Button Jetzt neu prüfen. Er holt Ihre robots.txt + llms.txt erneut, wertet den vollständigen 29-Bot-Katalog neu aus und feuert 5 Live-HTTP-HEAD-Anfragen ab (ein repräsentativer Bot pro Kategorie), um Runtime-Blocks (Cloudflare WAF, CDN-Bot-Filter, Geo-Beschränkungen) zu erkennen. Rate-limitiert auf einmal pro Minute pro Site.

Der ehrliche Vorbehalt

robots.txt ist beratend, nicht durchsetzend.

Seriöse Crawler (OpenAI, Anthropic, Google, Perplexity, Microsoft) respektieren robots.txt. Weniger seriöse ignorieren es. Ein "Blockiert"-Urteil bedeutet, dass der Bot höflich gebeten wurde, sich fernzuhalten — Ihr Server muss es immer noch durchsetzen, wenn Sie echten Schutz wollen. Zum aktiven Durchsetzen: Cloudflare-AI-Bot-Regeln, eine WAF-/Rate-Limit-Regel mit Match auf User-Agent oder ein server-seitiger Beacon (Zenovay V1.5 — misst echte Crawl-Events statt konfigurierter Zugriffe).

Registerkarte Metriken

Die Registerkarte Metriken ist KI-Referral-Analytics — menschliche Besucher, die von KI-Produkten kamen. Ein Besuch wird anhand von vier Signalen in Prioritätsreihenfolge als KI-originär klassifiziert:

Client-seitige KI-Quelle — der Tracker liest einen Hinweis aus dem In-App-Browser des KI-Produkts, falls vorhanden.
Referrer-Domain-Match — document.referrer matcht einen bekannten KI-Host (chat.openai.com, claude.ai, perplexity.ai, gemini.google.com, copilot.microsoft.com, deepseek.com, you.com, phind.com, t3.chat, kimi.com, +15 weitere).
UTM-Source-Match — die Kampagnen-URL trägt utm_source=chatgpt, utm_source=claude usw. (44 bekannte Varianten).
User-Agent-Match — der Besuch kam aus dem In-App-Browser eines KI-Produkts.

Jede erkannte KI-Quelle wird aufgeführt (nicht abgeschnitten). Jeder Besuch speichert seine ai_source und die ai_detection_method, die ihn klassifiziert hat, mit einem Confidence-Score 0,0–1,0, sodass das Panel Verteilung der Erkennungsmethoden exakt mit der Quellen-Aufschlüsselung übereinstimmt.

Dark AI

Ein großer Teil des KI-Traffics trägt keinen Referrer — der Nutzer hat Ihren Link aus einem Chat-Fenster in einen neuen Tab eingefügt, oder die KI-Oberfläche hat den Referrer entfernt. Eine tägliche Verhaltens-Heuristik fängt diesen "Dark AI"-Traffic über Direct-Traffic-Besucher ein:

Deep-Content-Landing (Eingang auf einer Longtail-URL, nicht /)
Single-Page-Focused-Reading (30–300 Sekunden, Scroll-Tiefe > 70 %)
Erstbesucher mit geringer Klick-Interaktion
Ankunft während der Geschäftszeiten

Ein Score ≥ 60 markiert den Besuch als is_ai_traffic=true mit ai_detection_method='behavioral_heuristic' und einer Confidence von 0,5–0,95. Erkennungsmethode und Confidence werden pro Besuch gespeichert, damit Sie ehrlich filtern, exportieren und auditieren können.

Was auf V2 vertagt wurde

Citation — Messung, wann Ihre Marke oder Seiten in KI-Antworten erscheinen. Erfordert einen Anbieter für Prompt-Monitoring oder einen eigenen Crawler. Wir liefern keine Zahlen, die wir nicht belegen können.
Assist — probabilistische Schätzung des Downstream-Uplifts in markenbezogener Suche nach KI-Exposition. Wird erst dargestellt, sobald wir Confidence ehrlich kennzeichnen können.

Wenn V2 ausgeliefert wird, trägt jede Metrik ein explizites gemessen vs. abgeleitet-Label.

Compliance

GPC (Global Privacy Control) wird respektiert — Besucher mit Sec-GPC: 1 werden nicht für KI-Verhaltens-Heuristiken verwendet.
IP-Adressen werden mit einem täglich rotierenden Salt gehasht — niemals im Klartext gespeichert.
Keine Cookies werden durch KI-Einfluss eingeführt — der bestehende Cookie-lose Tracker bleibt das einzige benötigte Skript.

API

GET /api/analytics/ai-influence?websiteId={id}&period={7d|30d|...}

Liefert:

{
  "crawl": {
    "summary": {
      "total": 29, "allowed": 6, "partial": 19, "blocked": 4,
      "indeterminate": 0, "never_checked": 0,
      "robots_txt_present": true, "llms_txt_present": true,
      "hostname": "example.com", "last_checked_at": "2026-05-16T08:14:23Z",
      "blocked_bots": ["Amazonbot", "Bytespider", "CCBot", "Meta-ExternalAgent"],
      "content_signals": { "search": true, "ai_train": false, "raw": "search=yes,ai-train=no" }
    },
    "crawlers": [{ "ua_token": "GPTBot", "vendor": "OpenAI", "category": "training", "verdict": "allowed", "restricted_paths": [], "...": "..." }]
  },
  "referral": { "summary": { "ai_visitors": 1247, "known_ai_visitors": 1100, "dark_ai_visitors": 147, "...": "..." }, "sources": [...], "trend": [...], "top_pages": [...] }
}

Hinweis: verdict ist im Roh-Payload einer von allowed / partial / blocked / indeterminate / never_checked; die UI fasst allowed + partial zu einem einzigen Zustand Erlaubt zusammen (siehe Was das Urteil bedeutet).

POST /api/analytics/ai-influence-probe?websiteId={id}

Löst einen synchronen Re-Fetch + Parse + 5 Live-HTTP-HEAD-Probes aus. Rate-limitiert auf 1 Anfrage pro Minute pro Website.

Verwandt

Page Flows — visualisiert emergente Besucher-Navigation.
Visitor Value Scoring — ranked Besuche nach prognostiziertem Lifetime-Wert.
Data Export — exportieren Sie KI-Traffic-Daten programmatisch.