Los agentes de IA leen tu web por el accessibility tree, no por lo que se ve: y en muchas webs está roto
Hay una capa de tu web que decide si un agente de IA puede leerte, y casi nadie la mira: el accessibility tree, la estructura semántica que los navegadores construyen para tecnologías de asistencia. Según Search Engine Journal, los agentes de IA interpretan tu sitio a través de ese árbol, no del diseño visual renderizado — y cuando está roto o incompleto (algo muy común en webs cargadas de JavaScript), los agentes malinterpretan o se saltan tu contenido. La buena noticia: lo que te hace accesible para una persona con lector de pantalla te hace legible para la IA. Análisis Citora.
Hay una capa invisible de tu web que decide si un agente de IA puede entenderte, y casi nadie la revisa: el accessibility tree (árbol de accesibilidad). Es la estructura semántica que el navegador construye a partir de tu HTML —encabezados, roles, etiquetas, relaciones entre elementos— y que usan las tecnologías de asistencia como los lectores de pantalla. Según Search Engine Journal, los agentes de IA interpretan tu sitio a través de ese árbol, no del diseño visual que ve un humano. Y aquí está el problema: en muchas webs modernas —especialmente las cargadas de JavaScript, con div para todo y poca semántica— el accessibility tree está roto o incompleto. Cuando eso pasa, el agente malinterpreta o directamente se salta tu contenido: no porque tu información sea mala, sino porque la capa por la que la lee está rota. Es un fallo de agent-readiness tan invisible como decisivo: puedes tener el mejor contenido del mundo y ser ilegible para la máquina que decide si recomendarte. La buena noticia, y no es menor: este problema ya tiene solución conocida y madura, porque lo que hace tu web accesible para una persona que usa lector de pantalla es exactamente lo que la hace legible para un agente de IA. La accesibilidad dejó de ser solo una cuestión de inclusión (que ya justificaba hacerla) para convertirse, además, en infraestructura de visibilidad IA.
Qué es el accessibility tree y por qué la IA lo usa
Cuando un navegador carga tu página, además del render visual construye una representación estructurada para tecnologías de asistencia: el accessibility tree. En él, un botón es un "botón", un encabezado es un "encabezado de nivel 2", una imagen tiene su texto alternativo, y los elementos guardan sus relaciones. Es una versión semántica y limpia de tu página — justo lo que una máquina necesita para entender qué es cada cosa, en lugar de adivinarlo desde píxeles y estilos.
Tiene todo el sentido que los agentes de IA lo usen: es la forma más fiable de "leer" una web sin depender de cómo se ve. El problema es que ese árbol solo es bueno si tu HTML es semántico. Si tu web está construida con div y span para todo, con interacciones en JavaScript que no exponen su rol, y sin estructura de encabezados real, el árbol que se genera es pobre — y el agente lee una versión degradada o incompleta de ti.
Por qué se rompe (y por qué casi nadie lo nota)
El accessibility tree se rompe por las mismas razones por las que una web es inaccesible para un lector de pantalla:
Todo son div: sin etiquetas semánticas (header, nav, main, article, button), el árbol no sabe qué es cada bloque.
Encabezados decorativos: texto que "parece" un título por su estilo CSS pero no es un h2 real. El agente no detecta la jerarquía.
Contenido inyectado por JavaScript sin roles: interacciones y contenido que se cargan dinámicamente sin exponer su significado al árbol.
Imágenes sin texto alternativo, datos atrapados en gráficos: información que existe visualmente pero no en el árbol semántico.
Y casi nadie lo nota porque la web se ve perfecta. El render visual para humanos puede ser impecable mientras el árbol semántico está hecho un desastre. Como el problema es invisible a ojo, se descubre solo cuando alguien lo busca — o cuando notas que la IA no te cita y no entiendes por qué. Es el primo del problema de bloquear bots sin saberlo (ver estás bloqueando bots IA sin saberlo): un fallo técnico silencioso que te resta visibilidad sin avisar.
La buena noticia: accesibilidad = agent-readiness
Lo mejor de este problema es que su solución ya existe, está documentada y es madura: es la accesibilidad web de toda la vida (WCAG, HTML semántico, ARIA). No hay que inventar una disciplina nueva "para la IA" — hay que hacer bien algo que ya deberíamos estar haciendo:
Buena práctica de accesibilidad
Por qué también ayuda al agente de IA
HTML semántico (header, main, article…)
El árbol sabe qué es cada bloque; el agente entiende la estructura
Jerarquía real de encabezados (h1→h2→h3)
El agente localiza secciones y extrae el contenido correcto
Texto alternativo en imágenes, datos en texto
La información no se pierde fuera del árbol semántico
Roles ARIA correctos en componentes interactivos
El agente entiende qué hace cada elemento, no solo cómo se ve
Dicho de otro modo: la inversión en accesibilidad —que ya estaba justificada por inclusión y, en muchos casos, por obligación legal— ahora rinde por partida doble, porque es también infraestructura de visibilidad IA. Dos retornos, un mismo trabajo.
Qué hacer (PYME B2B)
Audita tu accessibility tree: usa las DevTools del navegador (pestaña de accesibilidad) o un validador WCAG para ver cómo "ve" tu web una máquina. Suele haber sorpresas.
Prioriza HTML semántico: encabezados reales, etiquetas estructurales, no div para todo. Es el arreglo de mayor impacto.
Saca la información del píxel: datos clave en texto (no en imágenes ni gráficos sin alternativa), texto alternativo en imágenes relevantes.
Trátalo como agent-readiness, no solo como accesibilidad: el mismo arreglo mejora la experiencia de usuarios con lector de pantalla Y tu legibilidad para los agentes de IA.
Preguntas frecuentes
¿Qué es el accessibility tree?
Es la representación semántica y estructurada que el navegador construye de tu página para tecnologías de asistencia: identifica qué es cada elemento (botón, encabezado, enlace), su texto y sus relaciones. Según Search Engine Journal, los agentes de IA leen tu web a través de ese árbol, no del diseño visual renderizado.
¿Por qué un agente usa el árbol y no lo que se ve?
Porque el árbol es una versión limpia y semántica de tu página: dice qué es cada cosa, en lugar de obligar a la máquina a deducirlo desde píxeles y estilos. Es la forma más fiable de entender una web. El problema es que solo es bueno si tu HTML es semántico; si no, el árbol sale pobre y el agente lee una versión degradada.
¿Cómo sé si mi accessibility tree está roto?
Con las DevTools del navegador (tienen una pestaña de accesibilidad que muestra el árbol) o con un validador WCAG. Señales de alarma: todo construido con div, encabezados que son estilo CSS y no etiquetas reales, contenido que aparece por JavaScript sin roles, imágenes sin texto alternativo. La web puede verse perfecta y tener el árbol hecho un desastre.
¿Tengo que aprender una disciplina nueva "para la IA"?
No: es la accesibilidad web de siempre (HTML semántico, WCAG, ARIA). Lo nuevo es que ahora rinde doble — hace tu web usable para personas con lector de pantalla Y legible para los agentes de IA. La inversión que ya estaba justificada por inclusión ahora es también infraestructura de visibilidad IA.
¿Esto sustituye al contenido o al schema?
No, los complementa. El schema le dice a la máquina qué entidad eres; el accessibility tree le permite leer y estructurar tu contenido; el contenido es lo que finalmente cita. Si el árbol está roto, ni el mejor contenido ni el mejor schema se leen bien. Es una capa base sobre la que se apoyan las demás.
Siguiente paso
Si la IA no te cita, puede que el problema no sea tu contenido sino la capa por la que lo lee. El audit gratuito de Citora mide si los motores de IA te encuentran y te citan por las consultas de tu sector — la primera señal de si tu web es legible para la máquina o no. 2 minutos.
llms.txt se ha vendido como el atajo para que la IA te lea. Un análisis de Ahrefs sobre 137.000 sitios dice lo contrario: el 97% de los ficheros llms.txt no registró ni una sola lectura, y de las pocas peticiones que sí hubo, una parte venía de herramientas estudiando el formato, no de IAs consumiéndolo. Para una PYME B2B la lección no es "llms.txt es inútil", sino "no es el lever de visibilidad que te vendieron". Análisis Citora de dónde poner el esfuerzo de verdad.
Mayo 2026: el plugin AIOSEO (3M+ instalaciones activas en WordPress) introdujo auto-creación de llms.txt + archivos markdown ON BY DEFAULT. Millones de sites están publicando llms.txt sin que sus owners lo sepan. Análisis Citora: qué implica esto para los LLMs (¿ruido masivo o señal útil?), por qué tu PYME B2B NO debería preocuparse por aparecer aquí, y qué SÍ debes auditar en tu site WordPress esta semana.
Mientras la mayoría discute si bloquear o no a los rastreadores de IA, algunos publishers han dado un salto: el COO de Time explicó que ya comercializan una versión invisible, legible solo por bots, de su web — una página markdown despojada que sirven a las máquinas. ¿Por qué? Porque, en sus palabras, los bots no solo compran cada vez más: informan compras. La capa que lee la máquina está dejando de ser un subproducto técnico para convertirse en un canal comercial propio. Análisis Citora de qué significa esto para una PYME B2B.
Usamos cookies estrictamente necesarias para que la web funcione, y opcionales para analítica y para mostrar el widget de agenda. Puedes aceptarlas, rechazarlas o configurarlas. Más info en nuestra política de cookies.