AI Health Marketing
WhatsApp
Técnico

llms.txt e robots.txt: libere os robôs de IA certos

Se o robô da IA não pode entrar, ele não cita. Entenda robots.txt, llms.txt e quais crawlers liberar (GPTBot, PerplexityBot, Google-Extended).

Por Bruno Campos (brunocampos01) · 07 de maio de 2026 · 2 min de leitura

Existe um erro silencioso que torna um site invisível para a IA sem que o dono perceba: bloquear, sem querer, os robôs que geram as citações. Se o crawler não pode entrar, ele não lê — e se não lê, não cita. Dois arquivos pequenos controlam isso: o robots.txt e o llms.txt.

robots.txt: a portaria do site

O robots.txt diz a cada robô o que ele pode acessar. O problema é que muitos sites (e plugins de “segurança”) bloqueiam tudo que não seja o Googlebot — e acabam barrando justamente os crawlers de IA.

Para um consultório que quer ser citável, faz sentido liberar os robôs certos:

User-agent: GPTBot
Allow: /

User-agent: OAI-SearchBot
Allow: /

User-agent: PerplexityBot
Allow: /

User-agent: ClaudeBot
Allow: /

User-agent: Google-Extended
Allow: /
  • GPTBot / OAI-SearchBot / ChatGPT-User — ecossistema OpenAI (ChatGPT).
  • PerplexityBot — o buscador do Perplexity.
  • ClaudeBot — o crawler do Claude (Anthropic).
  • Google-Extended e Applebot-Extended — controlam o uso do conteúdo por Gemini e Apple Intelligence.

E há robôs que vale bloquear, como scrapers agressivos sem benefício de citação (por exemplo, Bytespider). Liberar não é “abrir tudo”: é abrir o que cita e fechar o que só raspa.

llms.txt: o resumo que a IA lê primeiro

O llms.txt é um padrão emergente: um arquivo em texto, na raiz do site, que oferece à IA um resumo limpo e estruturado da sua entidade — quem você é, o que faz, links principais, sem o ruído de menus e scripts. Pense nele como um “leia-me para máquinas”.

Para um médico, um bom llms.txt declara especialidade, cidade, registro, serviços e os links que importam — facilitando que o motor entenda e cite com precisão.

Por que isso é fundação, não detalhe

Você pode ter o melhor conteúdo do mundo: se o robots.txt barra o GPTBot, o ChatGPT nunca vai lê-lo. É como ter um consultório impecável com a porta trancada para quem indica pacientes. Esses arquivos são baratos de manter e dos primeiros itens que auditamos em qualquer diagnóstico.

A ressalva de sempre

Liberar crawlers não garante citação — garante apenas que você está elegível a ser citado. É condição necessária, não suficiente. Combinada com dados estruturados, NAP consistente e reputação, ela tira você da invisibilidade técnica. E, como sempre, tudo em conformidade com o CFM: visibilidade real, nunca posição garantida.

← Voltar para o blog