llms.txt e robots.txt: libere os robôs de IA certos
Se o robô da IA não pode entrar, ele não cita. Entenda robots.txt, llms.txt e quais crawlers liberar (GPTBot, PerplexityBot, Google-Extended).
Existe um erro silencioso que torna um site invisível para a IA sem que o dono perceba: bloquear, sem querer, os robôs que geram as citações. Se o crawler não pode entrar, ele não lê — e se não lê, não cita. Dois arquivos pequenos controlam isso: o robots.txt e o llms.txt.
robots.txt: a portaria do site
O robots.txt diz a cada robô o que ele pode acessar. O problema é que muitos sites (e plugins de “segurança”) bloqueiam tudo que não seja o Googlebot — e acabam barrando justamente os crawlers de IA.
Para um consultório que quer ser citável, faz sentido liberar os robôs certos:
User-agent: GPTBot
Allow: /
User-agent: OAI-SearchBot
Allow: /
User-agent: PerplexityBot
Allow: /
User-agent: ClaudeBot
Allow: /
User-agent: Google-Extended
Allow: /
- GPTBot / OAI-SearchBot / ChatGPT-User — ecossistema OpenAI (ChatGPT).
- PerplexityBot — o buscador do Perplexity.
- ClaudeBot — o crawler do Claude (Anthropic).
- Google-Extended e Applebot-Extended — controlam o uso do conteúdo por Gemini e Apple Intelligence.
E há robôs que vale bloquear, como scrapers agressivos sem benefício de citação (por exemplo, Bytespider). Liberar não é “abrir tudo”: é abrir o que cita e fechar o que só raspa.
llms.txt: o resumo que a IA lê primeiro
O llms.txt é um padrão emergente: um arquivo em texto, na raiz do site, que oferece à IA um resumo limpo e estruturado da sua entidade — quem você é, o que faz, links principais, sem o ruído de menus e scripts. Pense nele como um “leia-me para máquinas”.
Para um médico, um bom llms.txt declara especialidade, cidade, registro, serviços e os links que importam — facilitando que o motor entenda e cite com precisão.
Por que isso é fundação, não detalhe
Você pode ter o melhor conteúdo do mundo: se o robots.txt barra o GPTBot, o ChatGPT nunca vai lê-lo. É como ter um consultório impecável com a porta trancada para quem indica pacientes. Esses arquivos são baratos de manter e dos primeiros itens que auditamos em qualquer diagnóstico.
A ressalva de sempre
Liberar crawlers não garante citação — garante apenas que você está elegível a ser citado. É condição necessária, não suficiente. Combinada com dados estruturados, NAP consistente e reputação, ela tira você da invisibilidade técnica. E, como sempre, tudo em conformidade com o CFM: visibilidade real, nunca posição garantida.