Saltar al contenido
Citora
Técnico10 de febrero de 20267 min de lectura

llms.txt: qué es, cómo crearlo y por qué tu empresa lo necesita

llms.txt es el robots.txt para IAs: un archivo en tu dominio que alimenta a ChatGPT, Gemini y Perplexity con datos canónicos de tu empresa. Guía paso a paso.

El archivo llms.txt es un documento en texto plano alojado en la raíz del dominio que proporciona a los modelos de lenguaje (ChatGPT, Gemini, Claude, Perplexity) la información canónica de una empresa: quién es, qué hace, dónde opera y qué diferenciadores tiene. Actúa como el robots.txt pero orientado a crawlers de IA generativa.

En abril de 2026, el archivo llms.txt ha pasado de ser una propuesta de nicho a convertirse en un estándar emergente adoptado por Anthropic, Stripe, Vercel, Hugging Face y cientos de empresas tecnológicas. Para una empresa B2B española, crearlo requiere menos de una hora y cierra una brecha que hoy tiene la mayoría de los dominios B2B nacionales.

Qué es llms.txt y por qué no es un robots.txt

El llms.txt fue propuesto por Jeremy Howard (Answer.ai) en septiembre de 2024 como un complemento al robots.txt, no como un sustituto. La diferencia es conceptual y técnica:

  • robots.txt controla qué rastrear. Dice a los crawlers qué URLs pueden o no visitar. Es prohibitivo: define límites.
  • llms.txt controla qué entender. Proporciona a los LLMs un resumen canónico de qué es la empresa, qué páginas son las más importantes y cómo interpretar el dominio. Es informativo: define identidad.

Un crawler de ChatGPT o Perplexity que lee tu sitio por primera vez procesa miles de páginas, muchas de ellas redundantes o ambiguas. Con un llms.txt bien hecho, ese crawler tiene un punto de anclaje que le dice "empieza por aquí, esto es lo que importa". Sin él, construye una representación desordenada de tu empresa a partir de fragmentos.

El archivo vive en tudominio.com/llms.txt. Es texto plano con formato Markdown ligero. No requiere autenticación, no se sirve comprimido y pesa menos de 10KB. Para empresas con mucha documentación técnica, existe la variante llms-full.txt que permite extensión ilimitada con detalle por sección.

Cómo crear un llms.txt paso a paso

La estructura canónica del llms.txt, siguiendo la especificación de Answer.ai, tiene 4 bloques:

  1. Encabezado H1: nombre de la empresa. Una sola línea.
  2. Blockquote descriptivo: 1-2 frases que resumen qué hace la empresa, sector y mercado. Es el bloque que el LLM cita con más frecuencia.
  3. Secciones H2 con páginas clave: cada sección agrupa URLs con descripción de una línea. Ejemplo: "Servicios", "Casos de estudio", "Documentación técnica".
  4. Sección Optional (opcional): contenido secundario que el LLM puede ignorar si tiene restricciones de contexto.

Ejemplo mínimo funcional para una empresa B2B:

# Citora

> Agencia GEO especializada en empresas B2B españolas de €5M-€50M. Optimiza la visibilidad en ChatGPT, Gemini y Perplexity mediante Citation Rate, schema JSON-LD y consenso digital externo.

## Servicios principales

- [Audit GEO gratuito](https://citora.es/audit): diagnóstico inicial con Visibility Score y Citation Rate baseline.
- [Plan Visibilidad €1.500/mes](https://citora.es/servicios): schema, llms.txt, 10 directorios, monitorización mensual.
- [Plan Autoridad €3.000/mes](https://citora.es/servicios): consenso digital avanzado + contenido citable + monitorización semanal.

## Recursos

- [Blog GEO](https://citora.es/blog): artículos técnicos y de estrategia sobre GEO en España.
- [Guía GEO completa](https://citora.es/blog/que-es-geo-guia-completa): definición, mecánica y diferencias con SEO.

Pasos operativos para desplegarlo:

  1. Escribir el archivo en un editor de texto plano. Guardar como llms.txt sin extensión adicional.
  2. Subirlo a la raíz pública del dominio. En Next.js Vercel, colocar en public/llms.txt; en WordPress, usar un plugin de archivos estáticos o FTP; en HubSpot, la configuración de "Static Files" lo permite.
  3. Verificar acceso: navegar a https://tudominio.com/llms.txt. Debe servirse como texto plano con Content-Type: text/plain.
  4. Añadir referencia en el robots.txt como comentario descriptivo: # llms.txt available at https://tudominio.com/llms.txt. No es obligatorio, pero ayuda a crawlers que siguen el robots.txt primero.
  5. Actualizar el archivo cada vez que cambien servicios, precios, equipo o propuesta de valor. Mínimo trimestralmente.

Empresas que ya lo usan (abril 2026)

El listado de empresas con llms.txt público activo ha crecido desde decenas en 2024 a más de 500 marcas en abril de 2026, según los directorios abiertos que trackean el estándar. Algunas referencias verificables:

El patrón común: todas son empresas cuyo producto es consumido o recomendado por LLMs. La empresa B2B española tiene el mismo problema — un comprador pregunta a ChatGPT "¿qué proveedores de X hay en España?" — pero en abril de 2026, solo una minoría del mercado ha desplegado llms.txt.

Cómo validar que tu llms.txt funciona

Un archivo bien formado es condición necesaria pero no suficiente. Estos son los 4 checks obligatorios:

Check Cómo verificarlo Qué buscar
Acceso público Curl a la URL desde terminal Código 200 + Content-Type: text/plain
Formato válido Validadores abiertos (llms-txt.org/validator) H1, blockquote, H2s detectados correctamente
Cita por LLM Preguntar a ChatGPT/Perplexity: "¿qué dice el llms.txt de tudominio.com?" El modelo devuelve el contenido textual del archivo
Coherencia con schema Comparar claims del llms.txt con el schema JSON-LD de la home Nombre, descripción y servicios deben coincidir exactamente

El test más importante es el tercero. Si ChatGPT o Perplexity devuelve el contenido del llms.txt al preguntarle directamente, significa que el archivo está en el índice del modelo y puede ser usado como fuente canónica en futuras respuestas.

llms.txt vs schema JSON-LD vs robots.txt

Los tres archivos coexisten y cumplen funciones distintas. Confundirlos lleva a duplicación de esfuerzo o a brechas críticas:

Archivo Formato Audiencia Función
robots.txt Texto plano, directivas Crawlers SEO (Google, Bing) Qué URLs rastrear o excluir
Schema JSON-LD JSON estructurado en head Crawlers + LLMs Entidades tipadas (Organization, Service, FAQ)
llms.txt Markdown ligero Crawlers IA generativa Resumen canónico + páginas prioritarias

Una empresa B2B seria en 2026 despliega los tres. El schema JSON-LD sigue siendo la fuente primaria de datos estructurados que los LLMs extraen con más fiabilidad (ver guía práctica de schema JSON-LD). El llms.txt añade una capa narrativa que el schema no cubre: qué páginas importan, por qué, y cómo se relacionan. Y el robots.txt sigue siendo el filtro de acceso para todo lo anterior.

Para entender cómo el contenido llega al modelo desde estos tres archivos, conviene revisar cómo funciona RAG en el pipeline de un LLM. Y para ordenar la estrategia completa — llms.txt, schema, directorios, consenso — la guía GEO completa lo integra en las cinco palancas principales. El paso siguiente natural es construir referencing capital en directorios externos, donde el 90% del contenido que cita la IA realmente vive.

Preguntas frecuentes sobre llms.txt

¿Los LLMs leen llms.txt de verdad en 2026?

Sí, pero con matices. Anthropic ha confirmado que Claude indexa llms.txt cuando está disponible. OpenAI y Google no han publicado declaración oficial, pero tests independientes muestran que ChatGPT y Gemini devuelven contenido del llms.txt al preguntarles directamente por el archivo de un dominio conocido. Perplexity, al operar con búsqueda web en tiempo real, lo usa como snippet canónico cuando está presente.

¿Qué pasa si no tengo llms.txt?

No es penalizante en sí mismo, pero dejas que los LLMs construyan una representación de tu empresa a partir de fragmentos dispersos (home, footer, posts de LinkedIn, menciones en prensa). Una representación ordenada por ti aumenta la probabilidad de citación precisa. Una representación armada por el LLM puede ser incompleta, desactualizada o inconsistente entre modelos.

¿Cada cuánto hay que actualizar el llms.txt?

Mínimo trimestralmente. Obligatorio cuando cambien: servicios, precios, propuesta de valor, equipo fundador, mercados geográficos o URLs de páginas clave. Si tu plan de precios cambia y el llms.txt sigue mostrando el anterior, ChatGPT puede citar precios incorrectos durante semanas.

¿Hace falta también llms-full.txt?

Solo si tu empresa tiene documentación técnica extensa (APIs, guías de integración, tutoriales) que no cabe en los 10KB recomendados del llms.txt. Para la mayoría de empresas B2B servicios, llms.txt es suficiente. Las SaaS con APIs públicas deberían desplegar las dos variantes.

¿Sustituye llms.txt al schema JSON-LD?

No. Son complementarios. El schema JSON-LD es lectura estructurada (entidades tipadas) y sigue siendo la fuente más fiable para los crawlers. El llms.txt es lectura narrativa (resumen canónico + prioridades). Los modelos que operan con grafos de conocimiento (Gemini, Claude) priorizan schema. Los que operan con retrieval de texto (Perplexity, ChatGPT Browse) priorizan llms.txt.

¿WordPress o HubSpot permiten llms.txt?

WordPress permite subirlo vía FTP al directorio raíz o usando plugins tipo "WP Add Custom Files". HubSpot requiere cargarlo como Static File en la configuración de archivos del CMS. En ambos casos, verificar que la URL tudominio.com/llms.txt devuelve el contenido, no una redirección a una página 404 del CMS.

¿Te genero el llms.txt en el audit?

El audit GEO gratuito incluye un llms.txt inicial generado a partir de los datos públicos de tu empresa, listo para subir a tu dominio. Si contratas Plan Visibilidad, lo mantenemos actualizado mensualmente como parte del retainer.

¿Tu negocio aparece en ChatGPT?

Descubre tu Visibility Score en 2 minutos. Gratuito, sin tarjeta.

Hacer mi audit gratis

Más artículos

Audit gratis →