How is your website ranking on ChatGPT?
Cloudflare Content Signals Policy in robots.txt: Opt-out für AI Overviews, KI‑Crawler und Training
Cloudflare führt mit der Content Signals Policy ein präzises, kostenloses Opt-out-Signal für Suchmaschinen, KI‑Input und KI‑Training direkt in der robots.txt ein. Marketing- und SEO-Leads können damit AI Overviews steuern, Zitierungen gezielt beeinflussen und klare Verhandlungspositionen gegenüber KI‑Anbietern schaffen.

Vicky
Oct 3, 2025
Breaking: Ein Opt-out, das Marketing und SEO sofort nutzen können
Cloudflare bringt mit der Content Signals Policy eine neue, leicht umsetzbare Steuerung für den Umgang von Such- und KI-Systemen mit Website-Inhalten. Konkret ergänzt Cloudflare die robots.txt um eine maschinenlesbare Zeile und eine kurze, menschenlesbare Erläuterung. Damit können Sie getrennt entscheiden, ob Ihre Inhalte für klassische Websuche, für KI‑Input in Echtzeit sowie für KI‑Training verwendet werden dürfen. Der Clou: Das funktioniert planweit, ist kostenlos und ab sofort für alle Cloudflare-Zonen verfügbar. Die Ankündigung und die genaue Syntax finden Sie in Cloudflares Content Signals Policy.
Für Marketing- und SEO-Leads ist das ein seltener Moment strategischer Klarheit. Wir können erstmals präzise, öffentlich dokumentiert und skalierbar signalisieren, wo wir in Sachen Answer Engine Optimization (AEO) und KI-Nutzung die Linie ziehen. Und wir können die Wirkung zeitnah messen.
Was genau ist die Content Signals Policy
Die Policy erweitert Ihre robots.txt um zwei Bausteine:
- Kommentare, die für Menschen lesbar sind und die drei Inhalte-Nutzungen definieren.
- Eine maschinenlesbare Direktive, die Ihre Präferenz als Ja‑Nein‑Signale kodiert.
Die drei Signale sind:
- search: Erlaubnis, Inhalte für klassische Websuche zu indizieren und als Links mit kurzen Snippets auszuliefern. Wichtiger Punkt, der Missverständnisse vermeidet: Search umfasst nicht KI-generierte Suchzusammenfassungen.
- ai-input: Erlaubnis oder Verbot, Inhalte als Eingabe in ein KI-Modell zu nutzen, etwa für Live‑Grounding oder Retrieval‑Augmented Generation in Antwort-Engines und Overviews.
- ai-train: Erlaubnis oder Verbot, Inhalte für das Training oder Fine‑Tuning von KI‑Modellen zu verwenden.
Ein Beispiel, das klassische Suche erlaubt, KI‑Training untersagt und zum Live‑KI‑Input keine Präferenz äußert:
User-agent: *
Content-Signal: search=yes, ai-train=no
Allow: /
Wichtig: Das Weglassen eines Signals bedeutet nicht automatisch Zustimmung oder Ablehnung, sondern „keine Aussage via dieses Mechanismus“. Die Kommentare in der Datei erinnern zudem an eine rechtliche Dimension, die Cloudflare explizit macht, nämlich die urheberrechtlichen Vorbehalte in der Europäischen Union gemäß Artikel 4 der Richtlinie 2019/790 über das Urheberrecht im digitalen Binnenmarkt.
Opt-out für AI Overviews, aber mit Realismus
Die große Schlagzeile lautet: Website-Betreiber können sich gegen KI‑Overviews, KI‑Input und KI‑Training aussprechen. Heißt das, dass Google, OpenAI und andere Player Ihre Präferenzen immer befolgen werden? Realistisch betrachtet ist das ein Signal und kein physischer Blocker. Viele seriöse Crawler respektieren robots.txt, manche jedoch nicht. Cloudflare positioniert die Policy daher als einen klaren, öffentlich sichtbaren Präferenzstandard, der zwei Zwecke hat: erstens Compliance‑freundliche Bots zu lenken und zweitens Verhandlungsmacht zu schaffen, wenn es um Lizenzen, Fair Use oder technische Zugriffskontrolle geht.
Parallel stellt Google klar, wie AI Overviews und AI Mode in Search funktionieren, wie sie in der Search Console gezählt werden und welche technischen Hebel heute anerkannt sind. Offizielle Hinweise zu Berichtserfassung und Controlling liefert Google unter Googles Hinweise zu AI Overviews. Kurzfassung: Klicks aus AI‑Features zählen in Ihre Web‑Sichtbarkeit, erscheinen derzeit aber nicht als separater Kanal. Zur Begrenzung von Vorschauinhalten gelten weiterhin noindex oder Snippet‑Kontrollen, was zugleich die organische Sichtbarkeit beeinflusst. Ein dediziertes, garantiert wirksames robots‑Signal nur für AI Overviews existiert bei Google aktuell nicht. Kontext zu Such‑Antwortoberflächen finden Sie in unserem Beitrag Googles neuer AI Mode.
Warum das für AEO, Attribution und Budget relevant ist
Die SERP entwickelt sich zur Antwortoberfläche. AI Overviews, KI‑Mode und konkurrierende Antwort‑Engines referenzieren Quellen, erzeugen aber weniger Klicks je Impression. Das verschiebt die Wertschöpfung: Markenreichweite und Expertise werden in der SERP sichtbar, aber Sessions, CTR und nachgelagerte Conversions können schrumpfen. Gleichzeitig entsteht eine neue Kennzahlendynamik:
- Impressionen steigen, Klickrate sinkt, durchschnittliche Position wird volatiler, weil AI Overviews Links teils an anderer Stelle platzieren.
- Zitierungen ohne Klick nehmen zu, was Content‑Finanzierung unter Druck setzt.
- Brand‑ und Entity‑Optimierung fließt in AEO ein, nicht nur klassische Snippet‑Optimierung. Siehe auch Ask Brave liefert Detailantworten.
Mit Cloudflares Content Signals Policy lässt sich diese Dynamik erstmals aktiv beeinflussen. Sie können Search zulassen, KI‑Training untersagen und über ai-input die Teilnahme an Live‑Antworten steuern. Das eröffnet differenzierte Strategien, zum Beispiel: „Wir sind offen für klassische Suche und Zitierung, aber nicht für Training oder Echtzeit‑Input ohne Vertrag.“
Umsetzung: So setzen Sie die Policy in 30 Minuten auf
- robots.txt aktivieren oder anpassen
- In Cloudflare die verwaltete robots.txt aktivieren und die Content‑Signal‑Zeile setzen. Ausgangspunkt für die meisten Marken:
User-agent: *
Content-Signal: search=yes, ai-input=no, ai-train=no
Allow: /
- Für Bereiche, die Sie bewusst für KI‑Input zulassen möchten, können Sie auf Verzeichnisebene abweichen, etwa für Produktdatenblätter an Partner oder öffentliche Dokumentation.
- Bot‑Management ergänzen
- In Cloudflare Security‑Bots die Erkennung bekannter KI‑Crawler aktivieren. Kombinieren Sie Signale mit WAF‑Regeln, um nicht konforme Bots zu drosseln oder zu blockieren.
- Logging aktivieren: Markieren Sie Ereignisse, bei denen der User‑Agent oder Fingerprint einem KI‑Crawler entspricht und die Anfrage gegen Ihre Content‑Signale verstößt.
- Juristische und kommunikative Flankierung
- Die Kommentare in der robots.txt dokumentieren explizit, dass Sie Rechte vorbehalten. Stimmen Sie diese Linie mit Legal und Communications ab.
- Halten Sie Standardantworten für Anfragen von KI‑Anbietern bereit, inklusive Lizenzierungs‑ und Testbedingungen.
- Monitoring und Annotation
- Annotieren Sie in Ihren Dashboards den Go‑live‑Zeitpunkt der Policy. Das gilt für Search Console, Web Analytics, Logfiles und BI.
- Hinterlegen Sie Hypothesen je Signal, etwa: „ai-input=no führt zu weniger AI‑Overview‑Zitierungen, aber unveränderter Ranking‑Performance in klassischer Suche.“
Messung: So prüfen Sie den Effekt auf AI Overviews, Zitierungen und KPIs
Die Messung ist der kniffligste Teil, da Google AI Overviews gegenwärtig nicht als separaten Kanal ausweist und die Platzierung der Links variieren kann. Ein praxiserprobter Ansatz:
-
Search Console als Primärsignal
- Arbeiten Sie im Bericht „Leistung“ mit Suchtyp „Web“. Beobachten Sie Impressions, Klicks, CTR und Position für Queries, bei denen AI Overviews häufig auftreten, etwa W‑Fragen, komplexe How‑tos oder Vergleichsanfragen.
- Segmentieren Sie nach Inhaltstypen und Verzeichnissen, um A/B‑Muster sichtbar zu machen.
-
SERP‑Panels und Stichproben
- Erstellen Sie eine Query‑Stichprobe pro Cluster, etwa 200 bis 500 Keywords. Protokollieren Sie wöchentlich, ob AI Overviews erscheinen, wie viele Links sie enthalten, ob Ihre Domain dort auftaucht und ob eine Zitierung ohne Klick wahrscheinlich ist.
- Nutzen Sie strukturierte Checklisten, um Veränderungen über Zeit zu erkennen, etwa die Verschiebung von Featured Snippets hin zu Overviews.
-
Logfile‑Analyse
- Erkennen Sie bekannte KI‑Crawler via User‑Agent‑Strings und Fingerprints, ordnen Sie Zugriffe Ihren Content‑Signalen zu und identifizieren Sie Verstöße oder Verdachtsfälle.
- Koppeln Sie Log‑Events an Events in Analytics, um nachgelagerte Sessions zu identifizieren, die über alternative Wege kommen, etwa Direktaufrufe nach einer Overview‑Zitierung.
-
AEO‑Korrelationsanalyse
- Korrelationen sind keine Kausalität, aber nützlich: Plotten Sie pro Cluster die Veränderung von Impressions, CTR und Zitierungsraten im SERP‑Panel gegen Ihre Signaländerungen. Suchen Sie nach strukturellen Brüchen oder stufenweisen Effekten. Ergänzend lohnt der Blick auf die Perplexity Search API für Echtzeit, um Search‑Antwortlogiken besser zu verstehen.
Teams, die diese Auswertung wiederkehrend fahren, nutzen häufig ein Content‑ und SERP‑Panel, das sie mit Logdaten und Search Console verheiraten. Ein Beispiel: Upcite.ai wird von Growth‑Teams verwendet, um Zitierungen in Antwort‑Engines, Veränderungen in Snippets und die Wirkung von robots.txt‑Experimenten auf organische KPIs in einer Ansicht zu sehen.
Taktiklabor: Drei sinnvolle Startkonfigurationen
-
Konservativ für Publisher
- Ziel: maximale organische Sichtbarkeit, minimale unlizenzierte KI‑Nutzung.
- Einstellung: search=yes, ai-input=no, ai-train=no.
- Erwartung: klassische SEO bleibt intakt, AI‑Overviews könnten seltener auf Ihre Inhalte zugreifen. Zitierungen ohne Klick sinken, Long‑Tail‑Traffic bleibt stabil.
-
Kompromiss für Produkt‑ und Support‑Wissen
- Ziel: bessere Nutzererfahrung in Overviews für Supportfragen, aber kein Training.
- Einstellung: search=yes, ai-input=yes, ai-train=no auf /help, /docs, ansonsten ai-input=no.
- Erwartung: mehr Sichtbarkeit in Overviews bei Supportthemen, gesteuerte Teilnahme, begrenztes Risiko.
-
Lizenzvorbereitung
- Ziel: technisch klare Linie für Gespräche mit KI‑Anbietern.
- Einstellung: search=yes, ai-input=no, ai-train=no global, plus dokumentiertes Verfahren für Ausnahmen via IP‑ oder Token‑Whitelisting.
- Erwartung: saubere Ausgangslage für Tests und Verhandlung.
AEO‑Checkliste: Inhalte für AI Overviews lesbar machen, wenn gewünscht
Selbst wenn Sie ai-input aktuell verneinen, lohnt AEO‑Hygiene. Antwort‑Engines bewerten Struktur, Klarheit und Quellenangaben.
- Fragenorientierte Informationsarchitektur: H2‑ und H3‑Fragen, prägnante, belegte Antworten.
- Präzise, aktuelle Zahlen: definierte Begriffe, klare Beispiele mit Quantifizierung.
- Entitätenarbeit: Marken‑, Produkt‑ und Personennamen konsistent, strukturierte Daten stützen das sichtbare Wording.
- Zitierlogik: Wenn Overviews zitieren, steigen Ihre Chancen mit präzisen Definitionen, Bullet Points und sauber gekennzeichneten Referenzen auf der Seite.
Compliance, Grenzen und Fallstricke
- Nicht jeder Bot hält sich an robots.txt. Kombinieren Sie Signale mit Bot‑Management und WAF.
- Google erkennt derzeit kein separates robots‑Signal „AI Overviews aus, Websuche an“. Wenn Sie Inhalte aus Overviews fernhalten möchten, greifen Vorschau‑ und Index‑Kontrollen wie nosnippet oder noindex, die jedoch Ihre organische Sichtbarkeit beeinflussen. Googles offizielle Dokumentation beschreibt die Zählweise in Search Console und die verfügbaren Kontrollen, siehe Link oben.
- KI‑Training ist vom Live‑KI‑Input zu trennen. Google‑Extended oder andere Trainings‑Opt‑outs betreffen nicht zwangsläufig Antwort‑Features in der Suche. Prüfen Sie jede Nutzungskategorie separat.
- Rechtliche Hebel sind jurisdiktionsabhängig. Die ausdrücklichen Rechtevorbehalte in der robots.txt stärken Ihre Position, sie ersetzen jedoch keine Lizenz oder technische Durchsetzung.
Roadmap für Marketing‑ und SEO‑Leads: 4‑Wochen‑Plan
Woche 1
- Stakeholder‑Sync mit Legal, Data, SEO, PR. Entscheiden Sie Default‑Signale je Verzeichnis.
- robots.txt ausrollen, Cloudflare‑Bots aktivieren, Logging schärfen.
- Dashboards anlegen, Go‑live annotieren.
Woche 2
- Query‑Panel definieren, wöchentliches SERP‑Screenshotting starten.
- Baseline in Search Console exportieren, Cluster definieren.
- Erste Hypothesen formulieren, zum Beispiel: „ai-input=no senkt Zitierungen in Overviews um x Prozentpunkte“.
Woche 3
- Teilflächen‑Test: ein Verzeichnis temporär auf ai-input=yes stellen, Rest bleibt no. Laufzeit 14 Tage.
- A/B‑Monitoring der KPIs. Zusätzliche Beobachtung: Veränderungen bei Featured Snippets vs. Overviews.
Woche 4
- Auswertung, Entscheidung über Rollout oder weitere Tests.
- Gesprächsleitfaden für KI‑Anbieter finalisieren, inklusive technischer Freischaltung bei Lizenz.
Verhandlungsmacht nutzen
Die Policy schafft einen sichtbaren Default. Wer Ihre Präferenz respektiert, gewinnt Zugang. Wer abweicht, riskiert technische Blocks, öffentliche Dokumentation in Ihrer robots.txt und die Diskussion über Lizenzen. Für große Content‑Inhaber, Retailer mit umfangreichen Katalogen und Marken mit hochwertigen Ratgeberwelten ist das eine neue Ausgangslage, um zu bestimmen, wann Training oder Live‑Input gewünscht ist und zu welchen Konditionen.
Fazit und nächste Schritte
Cloudflares Content Signals Policy verschiebt die Entscheidungsgewalt spürbar zu den Rechteinhabern. Sie ist kein Allheilmittel, aber sie ist ein klarer, skalierbarer Standard, mit dem Sie heute handeln können. Für Marketing‑ und SEO‑Leads heißt das:
- Setzen Sie jetzt Ihre robots.txt mit getrennten Signalen für search, ai-input und ai-train auf.
- Aktivieren Sie Bot‑Management und Logging, um Ihre Präferenzen zu überwachen und durchzusetzen.
- Messen Sie die Effekte auf Impressions, CTR, Zitierungen und Conversions mit einer Query‑Stichprobe und Search‑Console‑Exports.
- Legen Sie eine Testroadmap fest, die Verzeichnisse, Zeitfenster und Hypothesen klar trennt.
- Bereiten Sie Verhandlungen mit KI‑Anbietern vor. Ihre robots.txt ist ab heute Teil Ihrer Content‑Lizenzstrategie.
Wer strukturiert vorgeht, kann AEO steuern, Zitierungen gewinnen, KPI‑Verluste begrenzen und gleichzeitig die eigene Verhandlungsposition stärken. Die Tools liegen bereit, die Entscheidung liegt bei Ihnen.