Saltar al contenido principal
9 min de lectura

Influencia IA

La vista Influencia IA muestra cómo las superficies de IA interactúan con tu sitio. Cubre dos cosas que realmente puedes medir hoy:

  1. Acceso de rastreadores de IA — cuál de los 29 bots de IA monitoreados permiten o bloquean tus declaraciones de robots.txt, llms.txt y Content-Signal.
  2. Referencias de IA — qué productos de IA te envían visitantes humanos (ChatGPT, Claude, Perplexity, Gemini, Copilot, DeepSeek y 20+ más).

Esto se expone en tres pestañas: Resumen (resumen de postura + inspección de robots/señales), Rastreadores (la tabla de catálogo completa de solo lectura) y Métricas (analítica de referencias de IA).

Dos capas adicionales — Citation (dónde aparece tu marca dentro de las respuestas de IA) y Assist (impulso probabilístico en búsqueda de marca tras exposición a IA) — están diferidas a V2 porque necesitan o bien un proveedor o bien modelado probabilístico consciente del riesgo. No enviaremos métricas vanidosas que no podamos medir rigurosamente.

Encontrarás Influencia IA en Intelligence → Influencia IA en el panel.

Influencia IA está disponible en todos los planes, incluido Gratis. La visibilidad del tráfico de IA es una señal de adquisición de línea base — no una característica de pago.

La IA como canal de ingresos. Esta página muestra el tráfico de IA. Cuando un visitante identificado como IA convierte, esa conversión también se atribuye a un canal AI de primera clase en Revenue → Attribution, con el mismo desglose por producto — más un grupo Likely AI (unspecified) para visitas detectadas por heurística que llegan sin referente. Usa esta página para el tráfico; usa la atribución de ingresos para las conversiones. (La atribución de ingresos se muestra en el panel autenticado, no en paneles públicos o compartidos.)

Pestaña Resumen

El Resumen responde una pregunta de un vistazo:

«¿Puede ChatGPT (o Claude, o Perplexity, …) rastrear mi sitio? ¿Bloqueé algo por accidente?»

Muestra un Resumen compacto (cuántos de los 29 bots monitoreados pueden rastrearte, cuántos están bloqueados en la raíz, visitas humanas de IA) y una tarjeta Robots y Señales que hace el veredicto verificable — enlaces directos «Ver en bruto» a tu robots.txt y llms.txt, la declaración Content-Signal parseada y la lista explícita de bots bloqueados en la raíz.

Content-Signal

Zenovay parsea la directiva Content-Signal que la «Managed robots.txt» de Cloudflare y un número creciente de sitios ahora emiten. Expresa la intención de uso de IA independientemente del acceso de rastreo:

  • search — ¿puede usarse tu contenido para construir un índice de búsqueda?
  • ai-input — ¿puede usarse como entrada en tiempo real para una respuesta generativa (RAG/grounding)?
  • ai-train — ¿puede usarse para entrenar o ajustar un modelo?

Cada uno se muestra como yes, no o unset. Esta es la declaración moderna de consentimiento de IA específica del contenido — distinta de un Disallow general.

Pestaña Rastreadores

Una tabla de solo lectura de los 29 rastreadores de IA monitoreados con el acceso configurado de cada bot en tu sitio. Deliberadamente no es un panel de control — Zenovay lee robots.txt; no aplica bloqueos en el edge. Reporta lo que declara tu robots.txt.

Los 29 bots se agrupan en 5 categorías:

  • Asistentes de IA en vivo — obtienen páginas bajo demanda para responder preguntas de usuarios: ChatGPT-User, Perplexity-User, ClaudeBot, Bingbot (Copilot), Applebot-Extended.
  • Entrenamiento de modelos — recolectan contenido para corpus de entrenamiento: GPTBot, Google-Extended, anthropic-ai, Common Crawl (CCBot), Meta-ExternalAgent, Bytespider, Amazonbot.
  • Agentes de navegador IA — agentes de tareas autónomos que navegan en nombre de un usuario: ChatGPT-Operator, Claude-Computer-Use, You.com Agent.
  • Scrapers comerciales — feeds de minería de datos vendidos a laboratorios de IA: DataForSEO Bot, PetalBot, Webz.io.
  • Búsqueda con superposiciones de IA — índices de búsqueda primarios cuyos resultados alimentan las respuestas de IA: Googlebot (AI Overviews).

Qué significa el veredicto

Para una herramienta de acceso-a-contenido-de-IA la única pregunta que importa es «¿puede este bot alcanzar mi contenido?». El veredicto se reporta por tanto en tres estados:

  • Permitido — el bot está autorizado en la raíz de tu sitio. Esto incluye bots que están permitidos en la raíz pero excluidos de rutas genéricas de infraestructura (/api, /_next, /e, …) — esas exclusiones se muestran como un pie de texto, no una alarma, porque no restringen el contenido.
  • Bloqueado — el bot está prohibido en la raíz del sitio por robots.txt.
  • Desconocido — no pudimos leer tu robots.txt (error de red, 5xx, mal formado) o el sitio aún no ha tenido su primera verificación (los sitios nuevos se verifican dentro de 24 horas).

Combinación de grupos RFC 9309 (importante si usas Cloudflare Managed robots.txt)

Seguimos RFC 9309. Los tokens UA se comparan sin distinguir mayúsculas/minúsculas como subcadenas (por lo que ClaudeBot coincide con Anthropic-ClaudeBot). Crucialmente, todos los grupos User-agent que coinciden con un bot se combinan, luego se aplica la precedencia de coincidencia más larga con Allow ganando los empates.

Esto importa porque la Managed robots.txt de Cloudflare emite un bloque gestionado que aplica Disallow: / a muchos bots de IA, y los propietarios de sitios frecuentemente añaden un grupo personalizado posterior que vuelve a aplicar Allow: / a los que quieren para visibilidad de IA. Un parser ingenuo de primera coincidencia reportaría erróneamente esos bots re-permitidos como Bloqueados. Zenovay combina los grupos y reporta el acceso efectivo del bot — coincidiendo con lo que un rastreador conforme realmente hace.

El botón «Volver a verificar»

El encabezado tiene un botón Volver a verificar. Vuelve a obtener tu robots.txt + llms.txt, reevalúa el catálogo completo de 29 bots y lanza 5 solicitudes HTTP HEAD en vivo (un bot representativo por categoría) para detectar bloqueos en tiempo de ejecución (WAF de Cloudflare, filtros anti-bot de CDN, restricciones geográficas). Limitado a una vez por minuto por sitio.

La advertencia honesta

robots.txt es consultivo, no de cumplimiento obligatorio.

Los rastreadores respetables (OpenAI, Anthropic, Google, Perplexity, Microsoft) respetan robots.txt. Los menos respetables lo ignoran. Un veredicto «Bloqueado» significa que se ha pedido amablemente al bot que se mantenga alejado — tu servidor aún tiene que hacerlo cumplir si quieres protección real. Para hacer cumplir activamente: reglas de bot IA de Cloudflare, una regla WAF/rate-limit que coincida con User-Agent, o una baliza del lado del servidor (Zenovay V1.5 — mide eventos de rastreo reales en vez de acceso configurado).

Pestaña Métricas

La pestaña Métricas es analítica de referencias de IA — visitantes humanos que llegaron desde productos de IA. Una visita se clasifica como originaria de IA usando cuatro señales, en orden de prioridad:

  1. Fuente IA del lado del cliente — el rastreador lee una pista del navegador in-app del producto de IA si está presente.
  2. Coincidencia de dominio del referentedocument.referrer coincide con un host de IA conocido (chat.openai.com, claude.ai, perplexity.ai, gemini.google.com, copilot.microsoft.com, deepseek.com, you.com, phind.com, t3.chat, kimi.com, +15 más).
  3. Coincidencia de fuente UTM — la URL de campaña lleva utm_source=chatgpt, utm_source=claude, etc. (44 variantes conocidas).
  4. Coincidencia de User-Agent — la visita provino del navegador in-app de un producto de IA.

Cada fuente de IA detectada se lista (no truncada). Cada visita almacena su ai_source y el ai_detection_method que la clasificó, con una puntuación de confianza de 0,0–1,0, de modo que el panel Distribución del método de detección se reconcilia exactamente con el desglose de fuentes.

IA oscura

Una gran parte del tráfico llegado por IA no lleva referente — el usuario pegó tu enlace desde una ventana de chat en una pestaña nueva, o la superficie de IA eliminó el referente. Una heurística de comportamiento diaria captura esta «IA oscura» entre los visitantes de tráfico directo:

  • Aterrizaje en contenido profundo (entrada en una URL de cola larga, no /)
  • Lectura focalizada de una sola página (30–300 segundos, profundidad de scroll > 70 %)
  • Visitante primerizo con baja interacción de clic
  • Llegada en horario laboral

Una puntuación ≥ 60 marca la visita como is_ai_traffic=true con ai_detection_method='behavioral_heuristic' y confianza 0,5–0,95. El método de detección y la confianza se almacenan por visita para que filtres, exportes y audites honestamente.

Qué se difiere a V2

  • Citation — medir cuándo tu marca o páginas aparecen dentro de respuestas de IA. Requiere un proveedor de monitoreo de prompts o nuestro propio rastreador. No enviaremos números que no podamos sustentar.
  • Assist — estimación probabilística del impulso aguas abajo en búsqueda de marca tras exposición a IA. Se expondrá solo una vez que podamos etiquetar honestamente la confianza.

Cuando se envíe V2, cada métrica llevará una etiqueta explícita medido vs. inferido.

Cumplimiento

  • GPC (Global Privacy Control) es respetado — los visitantes con Sec-GPC: 1 no se usan para heurísticas comportamentales de IA.
  • Las direcciones IP se hashean con una sal de rotación diaria — nunca se almacenan en texto plano.
  • No se introducen cookies por Influencia IA — el rastreador sin cookies existente sigue siendo el único script requerido.

API

GET /api/analytics/ai-influence?websiteId={id}&period={7d|30d|...}

Devuelve:

{
  "crawl": {
    "summary": {
      "total": 29, "allowed": 6, "partial": 19, "blocked": 4,
      "indeterminate": 0, "never_checked": 0,
      "robots_txt_present": true, "llms_txt_present": true,
      "hostname": "example.com", "last_checked_at": "2026-05-16T08:14:23Z",
      "blocked_bots": ["Amazonbot", "Bytespider", "CCBot", "Meta-ExternalAgent"],
      "content_signals": { "search": true, "ai_train": false, "raw": "search=yes,ai-train=no" }
    },
    "crawlers": [{ "ua_token": "GPTBot", "vendor": "OpenAI", "category": "training", "verdict": "allowed", "restricted_paths": [], "...": "..." }]
  },
  "referral": { "summary": { "ai_visitors": 1247, "known_ai_visitors": 1100, "dark_ai_visitors": 147, "...": "..." }, "sources": [...], "trend": [...], "top_pages": [...] }
}

Nota: verdict es uno de allowed / partial / blocked / indeterminate / never_checked en el payload en bruto; la interfaz colapsa allowed + partial en un único estado Permitido (ver Qué significa el veredicto).

POST /api/analytics/ai-influence-probe?websiteId={id}

Activa un re-fetch + parse + 5 sondas HTTP HEAD en vivo sincrónicas. Limitado a 1 solicitud por minuto por sitio.

Relacionado

  • Page Flows — visualiza la navegación emergente de los visitantes.
  • Visitor Value Scoring — clasifica visitas por valor de vida predicho.
  • Data Export — exporta datos de tráfico de IA programáticamente.
¿Fue útil esta página?