9 min de lecture

Influence IA

La vue Influence IA montre comment les surfaces IA interagissent avec votre site. Elle couvre deux choses que vous pouvez réellement mesurer aujourd'hui :

Accès des crawlers IA — lesquels des 29 bots IA suivis vos déclarations robots.txt, llms.txt et Content-Signal autorisent ou bloquent.
Référents IA — quels produits IA vous envoient des visiteurs humains (ChatGPT, Claude, Perplexity, Gemini, Copilot, DeepSeek et 20+ autres).

Ces éléments sont présentés à travers trois onglets : Aperçu (résumé de la posture + inspection robots/signaux), Crawlers (le catalogue complet en lecture seule), et Métriques (analyse des référents IA).

Deux couches supplémentaires — Citation (où votre marque apparaît dans les réponses IA) et Assist (montée probabiliste dans la recherche de marque après exposition IA) — sont reportées à V2 car elles nécessitent soit un fournisseur, soit une modélisation probabiliste prudente. Nous ne livrons pas de métriques vanité que nous ne pouvons pas mesurer rigoureusement.

Vous trouverez l'Influence IA sous Intelligence → Influence IA dans le tableau de bord.

L'Influence IA est disponible sur tous les plans, y compris Gratuit. La visibilité du trafic IA est un signal d'acquisition de base — pas une fonctionnalité payante.

L'IA comme canal de revenus. Cette page montre le trafic IA. Lorsqu'un visiteur identifié comme IA convertit, cette conversion est également attribuée à un canal AI de premier ordre dans Revenue → Attribution, avec la même répartition par produit — ainsi qu'un compartiment Likely AI (unspecified) pour les visites détectées par heuristique qui arrivent sans référent. Utilisez cette page pour le trafic ; utilisez l'attribution des revenus pour les conversions. (L'attribution des revenus est affichée sur le tableau de bord authentifié, pas sur les tableaux de bord publics ou partagés.)

Onglet Aperçu

L'Aperçu répond à une question en un coup d'œil :

« ChatGPT (ou Claude, ou Perplexity, …) peut-il explorer mon site ? Ai-je bloqué quelque chose par erreur ? »

Il affiche un Résumé compact (combien des 29 bots suivis peuvent vous explorer, combien sont bloqués à la racine, visites humaines IA) et une carte Robots & Signaux qui rend le verdict vérifiable — des liens directs « Voir la source brute » vers vos robots.txt et llms.txt, la déclaration Content-Signal analysée, et la liste explicite des bots bloqués à la racine.

Content-Signal

Zenovay analyse la directive Content-Signal que la « Managed robots.txt » de Cloudflare et un nombre croissant de sites émettent désormais. Elle exprime l'intention d'usage IA indépendamment de l'accès au crawl :

search — votre contenu peut-il être utilisé pour construire un index de recherche ?
ai-input — peut-il être utilisé comme entrée en temps réel d'une réponse générative (RAG/grounding) ?
ai-train — peut-il être utilisé pour entraîner ou affiner un modèle ?

Chacune est affichée comme yes, no, ou unset. C'est la déclaration moderne de consentement IA spécifique au contenu — distincte d'un Disallow global.

Onglet Crawlers

Un tableau en lecture seule des 29 crawlers IA suivis avec l'accès configuré de chaque bot sur votre site. Ce n'est délibérément pas un panneau de contrôle — Zenovay lit robots.txt ; il n'applique pas de blocages côté edge. Il rapporte ce que votre robots.txt déclare.

Les 29 bots sont regroupés en 5 catégories :

Assistants IA en direct — récupèrent les pages à la demande pour répondre aux questions des utilisateurs : ChatGPT-User, Perplexity-User, ClaudeBot, Bingbot (Copilot), Applebot-Extended.
Entraînement de modèles — récoltent le contenu pour les corpus d'entraînement : GPTBot, Google-Extended, anthropic-ai, Common Crawl (CCBot), Meta-ExternalAgent, Bytespider, Amazonbot.
Agents navigateurs IA — agents de tâches autonomes naviguant pour le compte d'un utilisateur : ChatGPT-Operator, Claude-Computer-Use, You.com Agent.
Scrapers commerciaux — flux de data-mining vendus aux laboratoires IA : DataForSEO Bot, PetalBot, Webz.io.
Recherche avec surcouches IA — index de recherche primaires dont les résultats alimentent les réponses IA : Googlebot (AI Overviews).

Ce que signifie le verdict

Pour un outil d'accès au contenu par l'IA, la seule question qui compte est « ce bot peut-il atteindre mon contenu ? ». Le verdict est donc rapporté en trois états :

Autorisé — le bot est permis à la racine de votre site. Cela inclut les bots autorisés à la racine mais exclus des chemins d'infrastructure génériques (/api, /_next, /e, …) — ces exclusions sont affichées comme une légende, pas une alarme, car elles ne restreignent pas le contenu.
Bloqué — le bot est interdit à la racine du site par robots.txt.
Inconnu — nous n'avons pas pu lire votre robots.txt (erreur réseau, 5xx, mal formé) ou le site n'a pas encore eu sa première vérification (les nouveaux sites sont vérifiés dans les 24 heures).

Combinaison de groupes RFC 9309 (important si vous utilisez Cloudflare Managed robots.txt)

Nous suivons RFC 9309. Les tokens UA sont comparés sans tenir compte de la casse en tant que sous-chaînes (donc ClaudeBot correspond à Anthropic-ClaudeBot). Surtout, tous les groupes User-agent qui correspondent à un bot sont combinés, puis la précédence de correspondance la plus longue est appliquée avec Allow gagnant les égalités.

Cela importe parce que la Managed robots.txt de Cloudflare émet un bloc géré qui fait un Disallow: / sur de nombreux bots IA, et les propriétaires de sites ajoutent fréquemment un groupe personnalisé ultérieur qui re-Allow: / ceux qu'ils veulent pour la visibilité IA. Un analyseur naïf en première correspondance rapporterait à tort ces bots ré-autorisés comme Bloqués. Zenovay combine les groupes et rapporte l'accès effectif du bot — correspondant à ce qu'un crawler conforme fait réellement.

Le bouton « Revérifier maintenant »

L'en-tête comprend un bouton Revérifier maintenant. Il re-récupère vos robots.txt + llms.txt, réévalue le catalogue complet de 29 bots, et lance 5 requêtes HTTP HEAD en direct (un bot représentatif par catégorie) pour détecter les blocages en exécution (WAF Cloudflare, filtres anti-bot CDN, restrictions géographiques). Limité à une fois par minute par site.

L'avertissement honnête

robots.txt est consultatif, pas exécutoire.

Les crawlers réputés (OpenAI, Anthropic, Google, Perplexity, Microsoft) honorent robots.txt. Les moins réputés l'ignorent. Un verdict « Bloqué » signifie que le bot a été poliment prié de rester à l'écart — votre serveur doit toujours l'appliquer si vous voulez une vraie protection. Pour appliquer activement : règles AI-bot Cloudflare, une règle WAF/rate-limit correspondant à l'User-Agent, ou une balise côté serveur (Zenovay V1.5 — mesure les vrais événements de crawl plutôt que l'accès configuré).

Onglet Métriques

L'onglet Métriques est l'analyse des référents IA — les visiteurs humains arrivés depuis des produits IA. Une visite est classifiée comme originaire d'IA à l'aide de quatre signaux, par ordre de priorité :

Source IA côté client — le tracker lit un indice depuis le navigateur in-app du produit IA s'il est présent.
Correspondance de domaine de référent — document.referrer correspond à un hôte IA connu (chat.openai.com, claude.ai, perplexity.ai, gemini.google.com, copilot.microsoft.com, deepseek.com, you.com, phind.com, t3.chat, kimi.com, +15 autres).
Correspondance de source UTM — l'URL de campagne porte utm_source=chatgpt, utm_source=claude, etc. (44 variantes connues).
Correspondance d'User-Agent — la visite provient du navigateur in-app d'un produit IA.

Chaque source IA détectée est listée (non tronquée). Chaque visite stocke sa ai_source et la ai_detection_method qui l'a classifiée, avec un score de confiance 0,0–1,0, de sorte que le panneau Distribution des méthodes de détection se réconcilie exactement avec la répartition des sources.

IA noire

Une grande partie du trafic arrivé par IA ne porte aucun référent — l'utilisateur a collé votre lien depuis une fenêtre de chat dans un nouvel onglet, ou la surface IA a supprimé le référent. Une heuristique comportementale quotidienne attrape cette « IA noire » parmi les visiteurs en trafic direct :

Atterrissage sur du contenu profond (entrée sur une URL longue-traîne, pas /)
Lecture focalisée sur une seule page (30–300 secondes, profondeur de défilement > 70 %)
Visiteur primo-arrivant avec faible interaction de clic
Arrivée pendant les heures d'ouverture

Un score ≥ 60 marque la visite comme is_ai_traffic=true avec ai_detection_method='behavioral_heuristic' et une confiance de 0,5–0,95. La méthode de détection et la confiance sont stockées par visite afin de pouvoir filtrer, exporter et auditer honnêtement.

Ce qui est reporté à V2

Citation — mesurer quand votre marque ou vos pages apparaissent dans les réponses IA. Nécessite un fournisseur de prompt-monitoring ou notre propre crawler. Nous ne livrons pas de chiffres que nous ne pouvons étayer.
Assist — estimation probabiliste de la montée en aval dans la recherche de marque après exposition IA. Remontée seulement quand nous pourrons étiqueter honnêtement la confiance.

Lorsque V2 sera livré, chaque métrique portera une étiquette explicite mesuré vs. inféré.

Conformité

GPC (Global Privacy Control) est respecté — les visiteurs avec Sec-GPC: 1 ne sont pas utilisés pour les heuristiques comportementales IA.
Les adresses IP sont hachées avec un sel rotatif quotidien — jamais stockées en clair.
Aucun cookie n'est introduit par l'Influence IA — le tracker sans cookies existant reste le seul script requis.

API

GET /api/analytics/ai-influence?websiteId={id}&period={7d|30d|...}

Retourne :

{
  "crawl": {
    "summary": {
      "total": 29, "allowed": 6, "partial": 19, "blocked": 4,
      "indeterminate": 0, "never_checked": 0,
      "robots_txt_present": true, "llms_txt_present": true,
      "hostname": "example.com", "last_checked_at": "2026-05-16T08:14:23Z",
      "blocked_bots": ["Amazonbot", "Bytespider", "CCBot", "Meta-ExternalAgent"],
      "content_signals": { "search": true, "ai_train": false, "raw": "search=yes,ai-train=no" }
    },
    "crawlers": [{ "ua_token": "GPTBot", "vendor": "OpenAI", "category": "training", "verdict": "allowed", "restricted_paths": [], "...": "..." }]
  },
  "referral": { "summary": { "ai_visitors": 1247, "known_ai_visitors": 1100, "dark_ai_visitors": 147, "...": "..." }, "sources": [...], "trend": [...], "top_pages": [...] }
}

Note : verdict est l'un de allowed / partial / blocked / indeterminate / never_checked dans la charge utile brute ; l'interface fusionne allowed + partial en un seul état Autorisé (voir Ce que signifie le verdict).

POST /api/analytics/ai-influence-probe?websiteId={id}

Déclenche un re-fetch + parse + 5 sondes HTTP HEAD live synchrones. Limité à 1 requête/minute/site.

Connexes

Page Flows — visualise la navigation émergente des visiteurs.
Visitor Value Scoring — classe les visites par valeur lifetime prédite.
Data Export — exportez les données de trafic IA par programme.