El 96% de las PYME B2B españolas son invisibles en LLMs y el patrón de fallo es predecible. Cruzando 22 audits Citora 2025-2026, la distribución del fracaso GEO se reparte así: 40% fetchability (los crawlers IA no pueden acceder al site — WAF agresivo, robots.txt bloqueante, Cloudflare Bot Fight Mode), 25% readability (los crawlers acceden pero no pueden leer — contenido JS-rendered sin SSR, hidratación lenta, viewport vacío para bots agentic), 20% quotability (los crawlers leen pero el contenido no es citable — claims enterrados en párrafos largos, sin datos, sin frase auto-contenida), 15% structure (citable pero sin schema — el modelo no sabe que esa frase es la respuesta canónica). Diagnosticar el pilar que falla antes de invertir es la diferencia entre €25K perdidos en retainer y €2K bien invertidos.
El problema de gastar GEO sin diagnóstico previo
Patrón recurrente en propuestas comerciales de agencias GEO 2026: empezar el retainer en el pilar #4 (structure / schema JSON-LD) cuando el cliente falla en el pilar #1 (fetchability). El cliente paga 3-6 meses optimizando schema mientras Cloudflare Bot Fight Mode sigue bloqueando OAI-SearchBot — y se va con Visibility Score plano + factura €15-25K + cero diagnóstico real.
El framework de 4 pilares fuerza un orden: sin fetchability, los pilares 2-4 son irrelevantes. Sin readability, los pilares 3-4 son irrelevantes. Y así hasta el último. La inversión correcta es secuencial, no paralela.
Pilar 1 — Fetchability (40% del fracaso)
Mide: ¿pueden los crawlers IA (OAI-SearchBot, ClaudeBot, PerplexityBot, Google-Extended) acceder físicamente a tus URLs y descargar el HTML sin que el servidor o el WAF los rechace?
Causas habituales que vemos en audits
- Cloudflare Bot Fight Mode activado por defecto desde 2024 sin allowlist explícito → bloquea crawlers IA con CAPTCHA challenge. Ver nuestra guía OAI-SearchBot vs GPTBot.
- robots.txt mal copiado de plantilla 2018 con
Disallow: / para User-Agents wildcard, sin allowlist específico para IA.
- WAF custom (Akamai, Sucuri) con reglas tipo "block User-Agents containing 'bot'" sin excepciones.
- Rate limiting agresivo (50 req/min por IP) que descarta crawlers IA legítimos que samplean con muestreo amplio.
- Sites Webflow / Squarespace / Wix con configuración por defecto que añade Cloudflare layer sin que el dueño sepa.
Cómo diagnosticar el pilar 1
3 minutos de trabajo:
curl -A "OAI-SearchBot" https://tudominio.com -I
curl -A "ClaudeBot" https://tudominio.com -I
curl -A "PerplexityBot" https://tudominio.com -I
Si los 3 devuelven 200 OK: pilar 1 OK, pasa a pilar 2. Si devuelven 403, 429 o redirige a página de bot challenge: fallas en pilar 1 — fix antes de continuar. Complementa con log file analysis sobre logs de servidor de últimos 30 días: si no aparece ningún hit de OAI-SearchBot/ClaudeBot, el bloqueo es total.
Pilar 2 — Readability (25% del fracaso)
Mide: una vez los crawlers acceden, ¿pueden leer y entender el contenido real?
Causas habituales
- Site Single Page Application sin Server-Side Rendering: React/Vue/Angular que hidrata todo en client-side. Los crawlers agentic modernos (Bing, Perplexity) sí ejecutan JS pero con timeout de 3-5 segundos — si tu hidratación es lenta, capturan página vacía.
- Content gated tras login/popup: el bot ve la cookie banner / paywall, no el contenido. Schema
cssSelector markup ayuda parcialmente pero no es suficiente.
- Hero image lazy-load que no carga antes del screenshot agentic → el bot captura layout sin el contexto visual principal. Ver Lighthouse Agentic Browsing y CLS.
- Texto dentro de imágenes (banner hero, stats infographic): el bot no hace OCR efectivo en imagen sin alt text descriptivo.
Cómo diagnosticar el pilar 2
Test rápido con curl como bot agentic:
curl -A "Mozilla/5.0 (compatible; PerplexityBot/1.0)" https://tudominio.com/blog/post-importante
Si el output incluye el texto principal del post: pilar 2 OK. Si solo ves la shell HTML (header + footer sin contenido) o la cookie banner: SSR roto, fix urgente.
Verificación adicional con PageSpeed Insights sobre tus URLs principales: si LCP > 4s y CLS > 0.25, los bots agentic con timeout corto fallan al renderizar.
Pilar 3 — Quotability (20% del fracaso)
Mide: ¿el contenido está escrito en formato citable por un LLM, o son párrafos largos sin afirmaciones auto-contenidas?
El test de citación
Un LLM cita una marca cuando puede extraer una frase de 1-3 líneas que responde directamente a la query del usuario. Si tu mejor post sobre "GEO para PYME B2B" tiene la información dispersa en 8 párrafos de 200 palabras cada uno, el modelo no puede extraer una unidad citable y prefiere a otro site con la misma info empaquetada en una frase clara.
Causas habituales
- Estilo periodístico narrativo: introducción + contexto + argumento progresivo. Funciona para humanos pero no para extracción LLM.
- Datos enterrados: la cifra clave aparece en frase 47 del post, no en los primeros párrafos o como
<strong> destacado.
- FAQs ausentes: el formato pregunta-respuesta es el más fácilmente parseable por LLMs. Sin FAQs, el modelo invierte más esfuerzo en estructurar y prefiere otra fuente.
- Citation links externos ausentes: el LLM evalúa autoridad parcialmente por densidad de citation links. Posts sin links se perciben "no fact-checked".
Cómo diagnosticar el pilar 3
Test manual: pídele a ChatGPT directamente: "Encuentra en este URL [tu URL] la cifra X o respuesta a Y". Si tarda más de 5 segundos o falla, tu contenido no es quotable. Si responde inmediatamente con la cita exacta, OK.
Estructura quotable canónica para PYME B2B:
- Hero párrafo con la respuesta directa (3-5 líneas)
- Negrita en las cifras y conclusiones
- FAQs estructuradas con pregunta-respuesta clara
- Tablas comparativas para data points relacionados
- Citation links a fuentes primary (≥3 por post)
Pilar 4 — Structure (15% del fracaso)
Mide: ¿tu HTML está marcado con schema JSON-LD para que el LLM identifique entidades, relaciones y tipos de contenido?
Causas habituales
Por qué este pilar es solo 15% del fracaso
Schema es importante pero NO es driver. La paradoja Otterly mostró que schema impacta +1.500% en Google AIO pero ~0% en ChatGPT (que no parsea HTML directamente). Schema es señal de orden 5-6, no orden 1-2 como creen muchas agencias. Si pilares 1-3 fallan, tener schema perfecto no compensa.
El orden correcto de inversión
| Pilar | % fallo | Coste fix | Time-to-impact |
| 1. Fetchability | 40% | 0-2h dev (config WAF + robots) | 2-6 semanas (crawlers vuelven) |
| 2. Readability | 25% | 4-12h dev (SSR + lazy-load fix) | 4-8 semanas |
| 3. Quotability | 20% | 2-4h/post (rewrite estructura) | 6-12 semanas (recrawl + reindex) |
| 4. Structure | 15% | 4-12h dev (schema completo) | 4-8 semanas |
Total fix completo para PYME B2B típica: 10-30h dev + 8-15h marketing = €1.500-€4.000 internalizado, o €3.000-€8.000 subcontratado. Time-to-impact total: 10-16 semanas.
Caso real — PYME B2B FinTech, marzo-mayo 2026
Cliente: FinTech B2B compliance, €5M ARR. Visibility Score inicial 7/100.
Diagnóstico cross-pilar:
- Pilar 1 (fetchability): ❌ Cloudflare Bot Fight Mode activo, 0 hits OAI-SearchBot últimos 60 días
- Pilar 2 (readability): ⚠ Next.js con SSR OK, pero hero image lazy-load tarda 4.2s
- Pilar 3 (quotability): ❌ Posts estilo narrativo, cifras en párrafo 6+, sin FAQs
- Pilar 4 (structure): ⚠ Schema Organization básico, sin Article ni FAQPage
Plan ejecutado en orden:
- Semana 1-2: Cloudflare Verified Bots allowlist + robots.txt allow explícito. Coste: 1.5h dev.
- Semana 3: Hero image preload + dimensiones explícitas. Coste: 2h dev.
- Semana 4-8: Rewrite 12 posts pillar con estructura quotable + FAQs. Coste: 30h marketing.
- Semana 9-10: Schema Article + FAQPage en template blog. Coste: 4h dev.
Resultado semana 14:
- Visibility Score: 7 → 38 (+31 puntos)
- Citas Bing Copilot AI Performance: 0 → 9 mes
- Branded search GSC: +47% vs baseline
El cliente NO contrató "más contenido". Contrató diagnóstico cross-pilar + fix secuencial. ROI: €4.500 invertidos, primer cliente cerrado del nuevo pipeline IA mes 4 (LTV estimado €18K).
Preguntas frecuentes
¿Por qué pilar 1 es el 40% del fracaso si parece trivial de arreglar?
Porque la mayoría de PYME B2B nunca lo verifica. Cloudflare Bot Fight Mode lleva activado por defecto desde 2024; los CTOs configuraron el WAF "para protegerse" en 2024 sin saber que en 2025-2026 esto bloquearía OAI-SearchBot/ClaudeBot. Es fix trivial pero impacto enorme.
¿Puedo saltar pilar 1 y 2 si solo me interesa Perplexity?
No. Perplexity también respeta robots.txt y Cloudflare Bot Fight Mode bloquea PerplexityBot igual que a OAI-SearchBot. Los 4 motores principales (ChatGPT, Gemini, Claude, Perplexity) requieren fetchability + readability mínimas. Solo el peso por pilar cambia entre ellos.
¿Es schema realmente solo 15% del fracaso si todo el mundo lo vende?
Sí. Las agencias venden schema porque es lo más fácil de "entregar" como deliverable cuantificable (instalado SÍ/NO). Pero el modelo NO te cita más por tener schema perfecto si el bot no puede acceder a tu site (pilar 1) o tu contenido no es quotable (pilar 3). Schema amplifica el impacto del resto de pilares, no lo reemplaza.
¿Cuánto cuesta el diagnóstico cross-pilar antes de empezar?
Para PYME B2B con budget limitado: el audit gratuito de Citora incluye diagnóstico fetchability + readability + quotability + structure como primera pasada. 2 minutos, gratis. Sin esto, contratar agencia GEO antes de saber tu distribución de fallo es gastar a ciegas.
¿Qué pilar es más urgente para SaaS B2B vs industrial B2B?
SaaS B2B: típicamente fallan en pilar 2 (SPA sin SSR). Industrial B2B: típicamente fallan en pilar 1 (WAF antiguo agresivo) + pilar 3 (PDFs catálogo sin texto extractable). El diagnóstico cross-pilar revela tu vertical específica.
Siguiente paso
Antes de invertir €1.500-€5.000/mes en agencia GEO, mide tu distribución cross-pilar. El audit gratuito de Citora incluye análisis de los 4 pilares y te dice exactamente dónde estás fallando — sin coste, en 2 minutos. Con ese dato, cualquier propuesta de agencia se evalúa con criterio.
Lecturas relacionadas
Si quieres profundizar en piezas relacionadas con este tema: Log file analysis para crawlers IA, Lighthouse Agentic Browsing: CLS y Core Web Vitals para ChatGPT, OAI-SearchBot vs GPTBot: qué bloquear y por qué.