Kostenloses KI-Tool

robots.txt Generator.
KI-Crawler steuern.

KI-Training-Bots blockieren. KI-Search-Bots erlauben. Saubere robots.txt in Sekunden erstellen — GPTBot, CCBot und Google-Extended aussperren, Perplexity und ChatGPT-Browsing reinlassen. Kein Login. Vorschau aktualisiert sich live.

Kostenloses Tool. Kein Login. Sofort kopieren oder herunterladen.

Warum deine robots.txt ein KI-Update braucht

10+

KI-Crawler, die du mit einer Datei steuerst

2

Kategorien: Training-Bots vs. Search-Bots

< 2 Min.

zum Erstellen, Herunterladen und Deployen

100 %

kostenlos — kein Account, keine Limits

Was ist robots.txt — und warum ändern KI-Bots alles?

robots.txt ist eine Textdatei im Root deiner Domain (deinedomain.de/robots.txt), die Crawlern mitteilt, auf welche Seiten sie zugreifen dürfen. Gut erzogene Bots halten sich daran. KI hat zwei Crawler-Kategorien geschaffen: Training-Bots (scrapen Content für KI-Modelle) und Search-Bots (indexieren Content, damit KI dich in Live-Antworten zitieren kann). Dieser Generator hilft dir, beide zu steuern.

Was robots.txt leistet

  • • Blockiert KI-Training-Bots daran, deinen Content für kommerzielle Modelle zu nutzen.
  • • Erlaubt KI-Search-Bots, deine Site zu indexieren, damit du in KI-Antworten erscheinst.
  • • Sperrt private Bereiche (Admin, Login, Checkout) für alle Crawler.

Was robots.txt nicht leistet

  • • Es blockiert keine böswilligen Scraper — diese ignorieren robots.txt.
  • • Es garantiert keine KI-Zitationen oder verhindert die Nutzung bereits gecrawlter Inhalte.
  • • Es ersetzt nicht llms.txt — nutze beide für vollständige GEO-Kontrolle.

Grundinfos

Gib deine Domain ein — sie erscheint als Referenz-Kommentar in der generierten Datei.

Policy-Preset

Wähle ein Preset oder konfiguriere jeden Bot unten manuell.

KI-Training-Bots

Diese Bots scrapen deinen Content für KI-Trainingsdatensätze. Blockiere sie, um deinen Content vor der Nutzung zum Training kommerzieller Modelle zu schützen.

GPTBot OpenAI

Scraped Content für das Training von ChatGPT und OpenAI-Modellen.

Google-Extended Google

Trainiert Gemini und andere Google-KI-Modelle. Verschieden von Googlebot.

CCBot Common Crawl

Erstellt offene Datensätze für das Training von LLMs wie GPT.

anthropic-ai Anthropic

Wird für das Training der Claude-KI-Modelle eingesetzt.

Bytespider ByteDance

ByteDance-Crawler zur Sammlung von KI-Trainingsdaten.

Diffbot Diffbot

KI-gestützte Datenextraktion und Trainingsdatensatz-Erstellung.

KI-Suche & Antwort-Bots

Diese Bots indexieren deinen Content, damit KI-Engines dich in Live-Antworten zitieren können. Erlaube sie für bessere GEO-Sichtbarkeit.

PerplexityBot Perplexity

Treibt KI-generierte Antworten in der Perplexity-Suche an.

ChatGPT-User OpenAI

ChatGPT-Browsing-Modus — Echtzeit-Webzugriff für Antworten.

OAI-SearchBot OpenAI

OpenAI-Suchindexierung für KI-gestützte Antwortsysteme.

Meta-ExternalAgent Meta

Meta-KI-Suche, Discovery und Antwortgenerierung.

Amazonbot Amazon

Treibt Amazon-KI-Features, Alexa und Produktantworten an.

YouBot You.com

You.com KI-Suchmaschinen-Crawler und Indexer.

Klassische Suchmaschinen-Bots

Traditionelle Suchmaschinen-Crawler. Ihr Erlauben ist unverzichtbar für SEO — blockiere nur mit gutem Grund.

Googlebot Google

Google-Search-Crawler — unverzichtbar für SEO-Rankings.

Bingbot Microsoft

Bing-Search und Microsoft-KI-Suchindex.

Applebot Apple

Treibt Apple Search, Siri-Vorschläge und Spotlight an.

DuckDuckBot DuckDuckGo

DuckDuckGo datenschutzorientierter Suchindex.

Gesperrte Pfade

Pfade, die über User-agent: * für alle Crawler gesperrt sind. Für private, Admin- und nicht-indexierbare Bereiche.

Schnell hinzufügen:

Optionen

Live-Vorschau

# Gib deine Website-URL ein, um robots.txt zu generieren
robots.txt

Durchsetzung

Steuert Crawler-Zugriff. Blockiert oder erlaubt spezifische Bots und Pfade. Von gut erzogenen Crawlern eingehalten.

vs
llms.txt

Beratung

Steuert KI-Priorisierung. Schlägt vor, welche Seiten am autoritativsten sind. Beratend — kein Durchsetzungsmechanismus.

robots.txt ist Durchsetzung: es steuert Crawler-Zugriff. llms.txt ist Beratung: es steuert KI-Priorisierung. Nutze robots.txt, um Training-Bots zu blockieren und private Seiten einzuschränken. Nutze llms.txt, damit KI-Search-Bots wissen, welche Seiten dich am besten repräsentieren. Für vollständige GEO-Kontrolle brauchst du beide.

Deine llms.txt erstellen →

So deployst du robots.txt

  1. 1 Policy-Preset wählen oder Bots manuell konfigurieren. Private Pfade hinzufügen.
  2. 2 Die generierte robots.txt kopieren oder herunterladen.
  3. 3 Die Datei im Root deiner Domain ablegen — https://deinedomain.de/robots.txt. Bei Astro, Next.js, Netlify und Cloudflare Pages in den public/-Ordner.

Wo wird die Datei abgelegt?

Die Datei muss unter https://deinedomain.de/robots.txt erreichbar sein — niemals in einem Unterordner. Bei Astro, Next.js, Netlify und Cloudflare Pages kommt sie in den public/-Ordner. Bei WordPress ins Installationsverzeichnis.

Du willst, dass KI-Engines dich auch wirklich empfehlen?

robots.txt ist ein Baustein. EchoDestiny überwacht, wie ChatGPT, Perplexity, Gemini und Claude über deine Marke sprechen — und macht daraus priorisierte Maßnahmen.

Häufige Fragen zu robots.txt und KI-Crawlern

Ist der robots.txt-Generator wirklich kostenlos?

Ja — vollständig. Kein Login, keine E-Mail, kein Account. Alles wird im Browser generiert. Nichts, was du eingibst, wird an einen Server übertragen.

Was ist der Unterschied zwischen KI-Training-Bots und KI-Search-Bots?

KI-Training-Bots (GPTBot, Google-Extended, CCBot, anthropic-ai) scrapen Content für Trainingsdatensätze — sie machen das KI-Modell schlauer, helfen dir aber nicht, in Live-Antworten zitiert zu werden. KI-Search-Bots (PerplexityBot, ChatGPT-User, OAI-SearchBot) indexieren Content, damit KI-Engines dich in Echtzeit-Antworten referenzieren. Training-Bots blockieren, Search-Bots erlauben.

Verhindert das Blockieren von GPTBot, dass ChatGPT meine Site zitiert?

Nein — und das ist ein wichtiger Unterschied. GPTBot ist der Training-Crawler. Sein Blockieren verhindert, dass dein Content in OpenAIs Trainingsdatensätze einfließt. ChatGPT-User und OAI-SearchBot sind separate Crawler für Live-Browsing und Suchindexierung. GPTBot zu blockieren verhindert nicht, dass ChatGPT dich in Echtzeit-Antworten zitiert.

Was macht Google-Extended? Ist es dasselbe wie Googlebot?

Nein — es sind separate User-Agents. Googlebot crawlt Content für Google-Such-Rankings. Google-Extended ist ein eigenständiger Crawler zum Training von Gemini und anderen Google-KI-Produkten. Das Blockieren von Google-Extended hat keine Auswirkungen auf deine Google-Such-Rankings.

Was ist der Unterschied zwischen robots.txt und llms.txt?

robots.txt ist Durchsetzung — es teilt Crawlern mit, worauf sie zugreifen dürfen. llms.txt ist beratend — es schlägt vor, welche Seiten für KI-Kontext am autoritativsten sind. robots.txt steuert Zugriff, llms.txt steuert Priorisierung. Für vollständige GEO-Sichtbarkeit brauchst du beide.

Beeinträchtigt das Blockieren von KI-Training-Bots mein SEO?

Nein. Das Blockieren von KI-Training-Bots (GPTBot, Google-Extended, CCBot, anthropic-ai) beeinflusst deine Google-Such-Rankings nicht. Diese nutzen andere User-Agents als Googlebot, der für die Suche zuständig ist. Klassisches SEO bleibt unberührt.

Sollte ich alle KI-Bots blockieren, um meinen Content zu schützen?

Das Blockieren aller KI-Bots schützt Content vor Training, verhindert aber auch, dass KI-Suchmaschinen (Perplexity, ChatGPT-Browsing, Meta AI) dich indexieren und zitieren. Wenn GEO-Sichtbarkeit wichtig ist, blockiere nur Training-Bots und lasse Search-Bots zu. Das Preset "Maximum GEO" tut genau das.

Welche Pfade sollte ich zu den gesperrten Pfaden hinzufügen?

Pfade für Inhalte, die kein Crawler indexieren soll: /admin/, /login/, /checkout/, /api/ (bei sensiblen Daten), /wp-admin/ für WordPress sowie Staging- und private Bereiche. Blockiere keine Haupt-Content-Seiten — das schadet SEO und GEO-Sichtbarkeit.

Wo lege ich die robots.txt-Datei ab?

Unter https://deinedomain.de/robots.txt — immer im Domain-Root, niemals in einem Unterordner. Bei Astro, Next.js, Netlify und Cloudflare Pages in den public/-Ordner. Bei WordPress ins Installationsverzeichnis.

Was ist Crawl-delay und sollte ich es nutzen?

Crawl-delay teilt Bots mit, wie viele Sekunden sie zwischen Anfragen warten sollen. Nützlich bei Server-Last durch Crawler. Nicht von Googlebot unterstützt (Google hat eigene Crawl-Rate-Einstellungen), aber von Bingbot, Yandex und anderen respektiert.