Tu web invisible para la IA: cambialo en una tarde
Hay una conversación que está pasando ahora mismo, en millones de servidores de todo el mundo, y tu web probablemente no está participando en ella.
Los agentes de inteligencia artificial ( esos programas que buscan, analizan y actúan de forma autónoma en internet ) visitan webs constantemente. Buscan información, comparan opciones, ejecutan tareas para sus usuarios. Y cuando llegan a una web que no está preparada para recibirlos, simplemente siguen adelante. Es como entrar en una tienda donde no hay nadie, no hay carteles y no está claro ni qué venden.
En este artículo explicaremos qué significa tener una web «amigable para agentes de IA», por qué empieza a importar ahora, y qué puedes hacer hoy mismo para que la tuya esté preparada. Sin ser desarrollador y sin gastar dinero.
¿Qué es exactamente un agente de IA?
Antes de entrar en los pasos técnicos, vale la pena aclarar de qué estamos hablando.
Un agente de IA es un programa que usa inteligencia artificial para realizar tareas de forma autónoma. A diferencia de un chatbot que responde preguntas, un agente puede navegar por internet, consultar webs, comparar información, tomar decisiones y ejecutar acciones — todo sin que un humano esté supervisando cada paso.
Ejemplos concretos de lo que hacen ya hoy:
- Un usuario le pide a su asistente de IA que busque los mejores proveedores de un servicio en su ciudad. El agente visita varias webs, extrae información y devuelve un resumen comparativo.
- Una empresa usa agentes para monitorizar precios de competidores en tiempo real.
- Un desarrollador tiene un agente que consulta documentación técnica de forma automática para ayudarle a escribir código.
En todos estos casos, el agente necesita entender la web que visita. Y si la web no le da pistas claras, el resultado es peor para todos (especialmente para el dueño de esa web, que se queda fuera del radar).
Los 5 estándares que hacen tu web legible para agentes
Aquí están las cinco cosas concretas que puedes implementar. Las ordeno de más a menos impacto inmediato.
1. Cabeceras Link: el cartel en la puerta
Las cabeceras HTTP Link son mensajes que tu servidor envía junto con cada página, antes de que el contenido se cargue. Son invisibles para los visitantes humanos, pero los agentes las leen de inmediato.
Una cabecera Link bien configurada le dice al agente: «oye, si quieres saber más sobre cómo funciona esta web, mira aquí». Es como poner un cartel en la entrada de tu negocio con un plano del local.
El formato es sencillo:
Link: ; rel="api-catalog"
Esta línea le dice al agente que existe un catálogo de API en esa ruta, donde puede encontrar información estructurada sobre tu web.
En WordPress, se puede añadir con unas pocas líneas en el archivo functions.php del tema. En otros entornos, se configura directamente en el servidor web (Apache, Nginx) o en el panel de control de hosting.
2. El api-catalog: el mapa de tu web
El archivo api-catalog es un documento JSON que vive en una ruta estándar de tu web (/.well-known/api-catalog) y describe qué recursos y servicios ofreces.
Para una web con WordPress, esto es más sencillo de lo que parece: WordPress ya incluye una API REST por defecto, accesible en /wp-json. Solo hay que crear un archivo que apunte a ella.
El formato que los agentes esperan sigue el estándar RFC 9264, que define una estructura llamada «linkset»:
{
"linkset": [
{
"anchor": "https://tu-dominio.com",
"https://www.iana.org/assignments/relation/service-desc": [
{
"href": "https://tu-dominio.com/wp-json",
"type": "application/json",
"title": "WordPress REST API"
}
]
}
]
}
Esto le dice al agente exactamente dónde está tu API, qué tipo de datos devuelve y cómo se llama. Información básica, pero que marca la diferencia.
3. Content Signals: tus preferencias sobre la IA
El archivo robots.txt lleva décadas diciéndole a los buscadores qué pueden y qué no pueden indexar. Ahora existe una extensión llamada Content Signals que permite hacer lo mismo con los agentes de IA — pero con más matices.
Con Content Signals puedes declarar tres preferencias:
ai-train— ¿pueden usar tu contenido para entrenar modelos de IA?search— ¿pueden incluirte en resultados de búsqueda basados en IA?ai-input— ¿pueden usar tu contenido como contexto para responder preguntas?
Un ejemplo típico para una web profesional que quiere visibilidad pero no quiere que usen su contenido para entrenar modelos:
Content-Signal: ai-train=no, search=yes, ai-input=yes
Esta línea va al final del robots.txt. En WordPress, si no tienes un archivo robots.txt físico, hay que crearlo en la raíz de la web — WordPress genera uno virtual por defecto, pero el archivo físico tiene prioridad.
La importancia de esto va más allá de la técnica: es una declaración de intenciones. Le dices al ecosistema de IA cómo quieres ser tratado. Y aunque hoy no todos los agentes lo respetan, la tendencia es que esto se convierta en un estándar ampliamente adoptado.
4. Agent Skills: el manual de instrucciones
El estándar Agent Skills, impulsado originalmente por Anthropic y ahora de código abierto, permite publicar un índice de «habilidades» que los agentes pueden usar en tu web.
¿Qué es una habilidad en este contexto? Básicamente, un archivo con instrucciones en formato Markdown que explica al agente qué puede hacer en tu web, cómo funciona tu API, qué endpoints están disponibles y qué restricciones existen.
El índice vive en /.well-known/agent-skills/index.json y apunta a cada archivo de habilidades. Cada entrada incluye un nombre, una descripción, la URL del archivo y un hash SHA-256 para verificar la integridad.
Para una web sencilla, una sola habilidad es suficiente. Algo tan básico como «esta web usa WordPress, tiene una API REST pública en esta URL, el endpoint de usuarios está desactivado por seguridad» ya es información muy valiosa para un agente.
5. Seguridad: lo que no deben ver
Este punto no es un estándar de descubribilidad, pero es inseparable de todo lo anterior. Cuando abres tu web a los agentes de IA, también estás potencialmente exponiendo información que no quieres que sea pública.
El caso más común en WordPress: el endpoint /wp-json/wp/v2/users devuelve por defecto una lista de todos los usuarios del sitio, incluyendo sus nombres de usuario. Esa información es un regalo para alguien que quiera intentar acceder por fuerza bruta.
La solución es sencilla — unas pocas líneas en el functions.php eliminan ese endpoint sin afectar al resto de la API. Y complementar con protección del login (limitar intentos, cambiar la URL de acceso) completa una defensa básica pero efectiva.
Cómo verificar que todo funciona
Existe una herramienta gratuita llamada isitagentready.com que analiza cualquier URL y devuelve un informe detallado sobre su nivel de preparación para agentes.
El resultado se organiza en niveles:
- Nivel 1 — Basic Web Presence: robots.txt y sitemap correctos
- Nivel 2 — Bot-Aware: Content Signals, cabeceras Link y api-catalog
- Nivel 3 — Agent-Readable: soporte para Markdown (requiere infraestructura adicional)
- Niveles superiores: autenticación OAuth, servidores MCP, protocolos de pago para agentes
Para una web profesional estándar, llegar al Nivel 2 con todos los checks en verde es un objetivo completamente alcanzable en una tarde. Y ya te sitúa por delante de la inmensa mayoría de webs.
¿Y si no tengo WordPress?
Los conceptos son exactamente los mismos para cualquier tecnología. La diferencia está en cómo se implementan:
En webs estáticas (HTML puro, Jekyll, Hugo), los archivos .well-known se crean directamente en la carpeta pública y las cabeceras se configuran en el servidor o en el CDN.
En otras plataformas (Shopify, Squarespace, Webflow), las posibilidades dependen de lo que cada plataforma permita. Algunas tienen más flexibilidad que otras. Shopify, por ejemplo, permite modificar cabeceras HTTP a través de su sistema de temas.
En webs con Cloudflare, la implementación es especialmente sencilla, se pueden añadir cabeceras y servir archivos estáticos directamente desde las reglas de transformación, sin tocar el servidor de origen.
Lo que viene después
Los cinco pasos de este artículo son el nivel básico. Existe un ecosistema más amplio de estándares emergentes que van más lejos:
MCP (Model Context Protocol) permite que los agentes no solo lean tu web sino que ejecuten acciones en ella — buscar productos, rellenar formularios, consultar disponibilidad. Es el protocolo que conecta los agentes con las herramientas del mundo real.
WebMCP lleva esto al navegador, permitiendo que los agentes interactúen con tu web a través del propio Chrome. Todavía es experimental, pero es hacia donde vamos.
OAuth para agentes permite que un agente actúe en nombre de un usuario autenticado — imagina un agente que gestiona tus reservas, hace pedidos o actualiza tu perfil en diferentes servicios de forma autónoma y segura.
Todo esto está en construcción. Pero la base (que es lo que hemos cubierto en este artículo) ya es estable y ya tiene impacto real hoy.
Conclusión
Internet está cambiando de forma profunda. No es solo que la gente use más la IA para buscar cosas, es que la forma en que la información fluye por la red está evolucionando hacia un modelo donde los agentes son intermediarios habituales entre los usuarios y los contenidos.
Las webs que se preparen ahora para ese modelo tendrán ventaja. No porque exista un algoritmo que las premie (aunque eso también llegará), sino porque los agentes podrán encontrarlas, entenderlas y recomendarlas con mucha más precisión.
Y la inversión es mínima. Una tarde, unos pocos archivos, sin coste económico. La pregunta no es si merece la pena, es por qué no hacerlo ya.
Preguntas frecuentes
¿Va la IA a sustituir a los Project Managers?
No a los que aportan criterio, estrategia y gestión de personas. Sí a los que solo mueven tickets de una columna a otra en Jira.
2. ¿Qué metodología es mejor para trabajar con IA?
Cualquiera que sea híbrida y «light». Menos ceremonias vacías y más ciclos de retroalimentación cortos donde la IA pueda iterar rápido.
3. ¿Cómo afecta la IA al burnout del equipo?
Si se usa para reducir tareas tediosas, ayuda. Si se usa para exigir el triple de producción porque «ahora es más fácil», es una fábrica de bajas por ansiedad.