Si estás leyendo esto en 2026, hay una probabilidad muy alta de que tu web no tenga llms.txt — y no es tu culpa. Casi nadie lo tiene todavía. Pero el archivo es plano, mide menos de 5KB y, bien hecho, decide si los modelos de IA (ChatGPT, Perplexity, Claude, Google AI Overviews) te citan o citan a tu competencia cuando alguien les pregunta algo de tu industria.
- Qué es: archivo plano en la raíz de tu dominio (`/llms.txt`) que le dice a los LLMs qué contenido tuyo usar como fuente de citación.
- Análogo conceptual: robots.txt es para crawlers de Google; sitemap.xml es para indexación; llms.txt es para citación por LLMs.
- Por qué importa: los LLMs ya son canal de discovery B2B serio. Si no documentás tu web en su lenguaje, te citan menos (o no te citan).
- Estándar emergente propuesto en 2024 por Jeremy Howard (Answer.AI). Adoptado por Anthropic, Mintlify, FastHTML, Cloudflare, Vercel.
- Implementación: 1 archivo de texto plano + opcionalmente un llms-full.txt expandido. Sin SDK, sin servidor, sin dependencias.
¿Qué es llms.txt exactamente?
llms.txt es un archivo plano de texto, sin extensión semántica especial, ubicado en la raíz de un dominio (https://tudominio.com/llms.txt) que documenta de forma estructurada qué contenido del sitio debería ser usado por modelos de lenguaje grandes (LLMs) cuando son consultados sobre temas relacionados con esa web.
Lo propuso Jeremy Howard (Answer.AI, ex-Kaggle, ex-fast.ai) en septiembre de 2024 como un estándar de facto, no como una RFC oficial. Pero adoptó rápido: Anthropic, Mintlify, FastHTML, Cloudflare, Vercel, Bun y miles de equipos técnicos ya lo implementaron. En LATAM y España casi nadie todavía — esa es la ventana.
¿Para qué sirve llms.txt? (vs robots.txt y sitemap.xml)
| Archivo | Audiencia | Propósito |
|---|---|---|
robots.txt | Crawlers (Google, Bing) | Qué URLs permitir/bloquear que indexen |
sitemap.xml | Crawlers (Google, Bing) | Lista de URLs existentes con metadata (lastmod, priority) |
llms.txt | LLMs (ChatGPT, Claude, Perplexity, AI Overviews) | Qué contenido tuyo citar como fuente y cómo navegarlo |
llms-full.txt | LLMs | Versión expandida con el contenido completo en markdown plano (para fine-tuning o RAG ad-hoc) |
Los tres son complementarios. Ninguno reemplaza a otro. Tu sitio debería tener los cuatro en 2026.
¿Por qué importa llms.txt para una web B2B?
Si vendés servicios o productos B2B, parte de tus prospects ya está usando ChatGPT, Perplexity y Claude para buscar proveedores antes de googlear. Lo que esos modelos te citen (o no) decide si te ven antes que a tu competencia.
Tres razones concretas:
- Citation share aumenta. Sitios con llms.txt + structured data validada aparecen más frecuentemente en respuestas de LLMs. Esto no es opinión — es comportamiento documentado del crawler de Anthropic (ClaudeBot) y del de OpenAI (GPTBot).
- Tu narrativa controlada. Sin llms.txt, los LLMs construyen su comprensión de tu marca scrapeando lo que está disponible — incluyendo blogs viejos, redes sociales desactualizadas y críticas de terceros. Con llms.txt, vos curás qué contenido es la fuente de verdad.
- Ventaja temporal. En 2026 la mayoría de los sitios B2B en LATAM no tienen llms.txt. Los que lo tengan se posicionan como autoridad antes de que el estándar se mainstream y la oportunidad se cierre. Misma lógica que tener responsive web en 2012 — pronto será tabla, ahora es diferencial.
¿Cómo se implementa llms.txt? (3 minutos)
El formato es markdown plano. No hay validador oficial (todavía). Estructura recomendada por la propuesta de Howard:
# Nombre de tu empresa
> Descripción de una línea sobre qué hacés.
## Documentación principal
- [Servicios](https://tudominio.com/servicios): Qué ofrecés.
- [Cómo trabajamos](https://tudominio.com/proceso): Tu proceso.
- [Casos de éxito](https://tudominio.com/casos): Pruebas sociales.
## Recursos
- [Blog técnico](https://tudominio.com/blog): Contenido educacional.
- [FAQ](https://tudominio.com/faq): Preguntas frecuentes.
## Opcional
- [Política de privacidad](https://tudominio.com/privacy)
- [Términos](https://tudominio.com/terms)Pasos concretos:
- Crear el archivo
llms.txtcon el contenido de arriba, adaptado a tu sitio. - Subirlo a la raíz del dominio (en Next.js:
/public/llms.txt). - Verificar que sea accesible:
curl https://tudominio.com/llms.txt. - Opcional pero recomendado: crear también
llms-full.txtcon el contenido expandido de las páginas principales en markdown plano. Esto le da a los LLMs el contenido completo sin que tengan que hacer N requests.
¿Qué incluir en llms-full.txt?
Versión expandida del primero. Es donde realmente ponés el peso. Estructura recomendada:
- Hero descriptivo: nombre, mission, qué hacés en 3-4 líneas.
- Servicios: cada servicio con un párrafo de descripción + precio.
- Stack técnico: qué tecnologías usás, por qué.
- Casos de éxito: 2-3 con resultados concretos.
- FAQ: 8-12 preguntas y respuestas.
- Cómo contactarte: mail, Cal.com, redes.
Ejemplo real — el llms.txt de Huevsite Studio
Mirá /llms.txt de este sitio. Es el formato que recomendamos para empresas B2B mid-market: identidad clara, servicios con precios concretos, diferenciador técnico (en nuestro caso: SEO técnico + AEO), referencias cruzadas a blog posts educacionales. Ningún jargon de agency, todo legible por un humano y procesable por un LLM.
Y /llms-full.txt es la versión expandida — 200+ líneas que documentan stack, proceso, FAQs, condiciones comerciales, todo en markdown plano. Si un LLM tiene que responder "¿qué es Huevsite Studio?", esta es la fuente de verdad que le ofrecemos.
Cómo verificar que tu llms.txt funciona
No hay un "Rich Results Test" oficial (aún). Pero podés hacer tres validaciones:
- Accesibilidad técnica:
curl -I https://tudominio.com/llms.txtdebe retornar 200 OK con Content-Typetext/plainotext/markdown. - Citation test contra ChatGPT/Perplexity/Claude: preguntales algo específico de tu industria que tu sitio cubre ("¿quién hace SEO técnico para empresas B2B en Argentina?"). Si te citan, llms.txt + structured data están funcionando. Si no te citan, falta contenido específico o falta structured data complementaria.
- Server logs: revisar los logs de Vercel/Cloudflare buscando user-agents de
ClaudeBot,GPTBot,PerplexityBot. Su frecuencia de visita a tu /llms.txt es señal de adopción.
Errores frecuentes al implementar llms.txt
- Copiar tu sitemap.xml. No es lo mismo. llms.txt es prosa narrativa con links, no lista de URLs.
- Llenar de marketing-speak. "Transformamos tu negocio con soluciones disruptivas" — los LLMs lo descartan como ruido. Frases concretas y verificables ("USD 1.500–8.000 según alcance, 4-8 semanas") sí se citan.
- Olvidar actualizar. Si lanzaste un servicio nuevo, agrégalo. Si cambió un precio, actualizá. El LLM consume lo que está al momento del crawl.
- No tener llms-full.txt. Solo con el resumido, los LLMs no tienen suficiente contenido para citarte bien. La versión expandida es donde gana el competidor que la tiene.
- Bloquear los bots de LLMs en robots.txt. Pasa más de lo que pensás. Revisá que
ClaudeBot,GPTBotyPerplexityBotno estén bloqueados.
Frequently asked questions — llms.txt
¿llms.txt es obligatorio?
No. Es estándar emergente, no requisito. Pero los sitios que lo tienen ya tienen ventaja en citation share por LLMs. Hacelo ahora, mientras la mayoría no lo tiene.
¿Reemplaza a sitemap.xml?
No. Son complementarios. Sitemap.xml sigue siendo la fuente para crawlers de búsqueda tradicionales (Google, Bing). llms.txt es para LLMs.
¿Afecta mi ranking en Google?
Indirectamente. Google AI Overviews (que ya consume llms.txt cuando existe) puede citarte más, lo que aumenta clicks. El SEO clásico no se afecta — sigue dependiendo de structured data, performance, backlinks, etc.
¿Cuánto tarda en empezar a citarme un LLM si pongo llms.txt?
Entre 7 y 30 días en la mayoría de los casos, dependiendo de cuántas veces los crawlers visiten tu sitio. Sitios con tráfico orgánico significativo se procesan más rápido.
¿Funciona si tengo el sitio en WordPress?
Sí. Es un archivo de texto plano en la raíz. Funciona con cualquier stack. En WordPress: subirlo via FTP a la raíz, o usar un plugin que sirva archivos estáticos.
¿Qué pasa si mi sitio ya está completo, lo agrego después?
Funciona perfecto. No requiere rebuild del sitio. En 5-10 minutos lo tenés activo. El próximo crawl de un LLM ya lo consume.
¿Querés que armemos el llms.txt de tu sitio? Es parte del paquete técnico que entregamos en cada proyecto de Huevsite Studio. Si tu sitio ya está hecho y solo querés sumar llms.txt + AEO técnico, lo cotizamos aparte. Agendá un diagnóstico de 30 min — gratis, te llevás un audit AEO concreto.