KI-Training-Bots blockieren. KI-Search-Bots erlauben. Saubere robots.txt in Sekunden erstellen — GPTBot, CCBot und Google-Extended aussperren, Perplexity und ChatGPT-Browsing reinlassen. Kein Login. Vorschau aktualisiert sich live.
Kostenloses Tool. Kein Login. Sofort kopieren oder herunterladen.
Warum deine robots.txt ein KI-Update braucht
10+
KI-Crawler, die du mit einer Datei steuerst
2
Kategorien: Training-Bots vs. Search-Bots
< 2 Min.
zum Erstellen, Herunterladen und Deployen
100 %
kostenlos — kein Account, keine Limits
Was ist robots.txt — und warum ändern KI-Bots alles?
robots.txt ist eine Textdatei im Root deiner Domain (deinedomain.de/robots.txt), die Crawlern mitteilt, auf welche Seiten sie zugreifen dürfen. Gut erzogene Bots halten sich daran. KI hat zwei Crawler-Kategorien geschaffen: Training-Bots (scrapen Content für KI-Modelle) und Search-Bots (indexieren Content, damit KI dich in Live-Antworten zitieren kann). Dieser Generator hilft dir, beide zu steuern.
Was robots.txt leistet
• Blockiert KI-Training-Bots daran, deinen Content für kommerzielle Modelle zu nutzen.
• Erlaubt KI-Search-Bots, deine Site zu indexieren, damit du in KI-Antworten erscheinst.
• Sperrt private Bereiche (Admin, Login, Checkout) für alle Crawler.
Was robots.txt nicht leistet
• Es blockiert keine böswilligen Scraper — diese ignorieren robots.txt.
• Es garantiert keine KI-Zitationen oder verhindert die Nutzung bereits gecrawlter Inhalte.
• Es ersetzt nicht llms.txt — nutze beide für vollständige GEO-Kontrolle.
Grundinfos
Gib deine Domain ein — sie erscheint als Referenz-Kommentar in der generierten Datei.
Policy-Preset
Wähle ein Preset oder konfiguriere jeden Bot unten manuell.
KI-Training-Bots
Diese Bots scrapen deinen Content für KI-Trainingsdatensätze. Blockiere sie, um deinen Content vor der Nutzung zum Training kommerzieller Modelle zu schützen.
GPTBotOpenAI
Scraped Content für das Training von ChatGPT und OpenAI-Modellen.
Google-ExtendedGoogle
Trainiert Gemini und andere Google-KI-Modelle. Verschieden von Googlebot.
CCBotCommon Crawl
Erstellt offene Datensätze für das Training von LLMs wie GPT.
anthropic-aiAnthropic
Wird für das Training der Claude-KI-Modelle eingesetzt.
BytespiderByteDance
ByteDance-Crawler zur Sammlung von KI-Trainingsdaten.
DiffbotDiffbot
KI-gestützte Datenextraktion und Trainingsdatensatz-Erstellung.
KI-Suche & Antwort-Bots
Diese Bots indexieren deinen Content, damit KI-Engines dich in Live-Antworten zitieren können. Erlaube sie für bessere GEO-Sichtbarkeit.
PerplexityBotPerplexity
Treibt KI-generierte Antworten in der Perplexity-Suche an.
ChatGPT-UserOpenAI
ChatGPT-Browsing-Modus — Echtzeit-Webzugriff für Antworten.
OAI-SearchBotOpenAI
OpenAI-Suchindexierung für KI-gestützte Antwortsysteme.
Meta-ExternalAgentMeta
Meta-KI-Suche, Discovery und Antwortgenerierung.
AmazonbotAmazon
Treibt Amazon-KI-Features, Alexa und Produktantworten an.
YouBotYou.com
You.com KI-Suchmaschinen-Crawler und Indexer.
Klassische Suchmaschinen-Bots
Traditionelle Suchmaschinen-Crawler. Ihr Erlauben ist unverzichtbar für SEO — blockiere nur mit gutem Grund.
GooglebotGoogle
Google-Search-Crawler — unverzichtbar für SEO-Rankings.
BingbotMicrosoft
Bing-Search und Microsoft-KI-Suchindex.
ApplebotApple
Treibt Apple Search, Siri-Vorschläge und Spotlight an.
DuckDuckBotDuckDuckGo
DuckDuckGo datenschutzorientierter Suchindex.
Gesperrte Pfade
Pfade, die über User-agent: * für alle Crawler gesperrt sind. Für private, Admin- und nicht-indexierbare Bereiche.
Schnell hinzufügen:
Optionen
Live-Vorschau
# Gib deine Website-URL ein, um robots.txt zu generieren
robots.txt
Durchsetzung
Steuert Crawler-Zugriff. Blockiert oder erlaubt spezifische Bots und Pfade. Von gut erzogenen Crawlern eingehalten.
vs
llms.txt
Beratung
Steuert KI-Priorisierung. Schlägt vor, welche Seiten am autoritativsten sind. Beratend — kein Durchsetzungsmechanismus.
robots.txt ist Durchsetzung: es steuert Crawler-Zugriff. llms.txt ist Beratung: es steuert KI-Priorisierung. Nutze robots.txt, um Training-Bots zu blockieren und private Seiten einzuschränken. Nutze llms.txt, damit KI-Search-Bots wissen, welche Seiten dich am besten repräsentieren. Für vollständige GEO-Kontrolle brauchst du beide.
1Policy-Preset wählen oder Bots manuell konfigurieren. Private Pfade hinzufügen.
2Die generierte robots.txt kopieren oder herunterladen.
3Die Datei im Root deiner Domain ablegen — https://deinedomain.de/robots.txt. Bei Astro, Next.js, Netlify und Cloudflare Pages in den public/-Ordner.
Wo wird die Datei abgelegt?
Die Datei muss unter https://deinedomain.de/robots.txt erreichbar sein — niemals in einem Unterordner. Bei Astro, Next.js, Netlify und Cloudflare Pages kommt sie in den public/-Ordner. Bei WordPress ins Installationsverzeichnis.
Du willst, dass KI-Engines dich auch wirklich empfehlen?
robots.txt ist ein Baustein. EchoDestiny überwacht, wie ChatGPT, Perplexity, Gemini und Claude über deine Marke sprechen — und macht daraus priorisierte Maßnahmen.
Ja — vollständig. Kein Login, keine E-Mail, kein Account. Alles wird im Browser generiert. Nichts, was du eingibst, wird an einen Server übertragen.
Was ist der Unterschied zwischen KI-Training-Bots und KI-Search-Bots?
KI-Training-Bots (GPTBot, Google-Extended, CCBot, anthropic-ai) scrapen Content für Trainingsdatensätze — sie machen das KI-Modell schlauer, helfen dir aber nicht, in Live-Antworten zitiert zu werden. KI-Search-Bots (PerplexityBot, ChatGPT-User, OAI-SearchBot) indexieren Content, damit KI-Engines dich in Echtzeit-Antworten referenzieren. Training-Bots blockieren, Search-Bots erlauben.
Verhindert das Blockieren von GPTBot, dass ChatGPT meine Site zitiert?
Nein — und das ist ein wichtiger Unterschied. GPTBot ist der Training-Crawler. Sein Blockieren verhindert, dass dein Content in OpenAIs Trainingsdatensätze einfließt. ChatGPT-User und OAI-SearchBot sind separate Crawler für Live-Browsing und Suchindexierung. GPTBot zu blockieren verhindert nicht, dass ChatGPT dich in Echtzeit-Antworten zitiert.
Was macht Google-Extended? Ist es dasselbe wie Googlebot?
Nein — es sind separate User-Agents. Googlebot crawlt Content für Google-Such-Rankings. Google-Extended ist ein eigenständiger Crawler zum Training von Gemini und anderen Google-KI-Produkten. Das Blockieren von Google-Extended hat keine Auswirkungen auf deine Google-Such-Rankings.
Was ist der Unterschied zwischen robots.txt und llms.txt?
robots.txt ist Durchsetzung — es teilt Crawlern mit, worauf sie zugreifen dürfen. llms.txt ist beratend — es schlägt vor, welche Seiten für KI-Kontext am autoritativsten sind. robots.txt steuert Zugriff, llms.txt steuert Priorisierung. Für vollständige GEO-Sichtbarkeit brauchst du beide.
Beeinträchtigt das Blockieren von KI-Training-Bots mein SEO?
Nein. Das Blockieren von KI-Training-Bots (GPTBot, Google-Extended, CCBot, anthropic-ai) beeinflusst deine Google-Such-Rankings nicht. Diese nutzen andere User-Agents als Googlebot, der für die Suche zuständig ist. Klassisches SEO bleibt unberührt.
Sollte ich alle KI-Bots blockieren, um meinen Content zu schützen?
Das Blockieren aller KI-Bots schützt Content vor Training, verhindert aber auch, dass KI-Suchmaschinen (Perplexity, ChatGPT-Browsing, Meta AI) dich indexieren und zitieren. Wenn GEO-Sichtbarkeit wichtig ist, blockiere nur Training-Bots und lasse Search-Bots zu. Das Preset "Maximum GEO" tut genau das.
Welche Pfade sollte ich zu den gesperrten Pfaden hinzufügen?
Pfade für Inhalte, die kein Crawler indexieren soll: /admin/, /login/, /checkout/, /api/ (bei sensiblen Daten), /wp-admin/ für WordPress sowie Staging- und private Bereiche. Blockiere keine Haupt-Content-Seiten — das schadet SEO und GEO-Sichtbarkeit.
Wo lege ich die robots.txt-Datei ab?
Unter https://deinedomain.de/robots.txt — immer im Domain-Root, niemals in einem Unterordner. Bei Astro, Next.js, Netlify und Cloudflare Pages in den public/-Ordner. Bei WordPress ins Installationsverzeichnis.
Was ist Crawl-delay und sollte ich es nutzen?
Crawl-delay teilt Bots mit, wie viele Sekunden sie zwischen Anfragen warten sollen. Nützlich bei Server-Last durch Crawler. Nicht von Googlebot unterstützt (Google hat eigene Crawl-Rate-Einstellungen), aber von Bingbot, Yandex und anderen respektiert.