KI-Ergebnisse: So einfach lassen sie sich manipulieren

Show notes

KI-Systeme wie Google Gemini greifen gerne auf nutzergenerierte Inhalte zurück, wenn sie ihre Antworten erzeugen. Das gilt insbesondere bei umfangreichen Deep Researches. Das kann man nutzen, um die Ergebnisse zu manipulieren (sollte es aber dennoch besser sein lassen).

Manuelle Maßnahmen durch Google beeinträchtigen nicht nur die Sichtbarkeit in der klassischen Suche, sondern können auch zu Beeinträchtigungen in KI-Antworten wie den AI Overviews oder ChatGPT führen.

Änderungen an Website-weiten Rankingfaktoren wirken sich erst mit zeitlicher Verzögerung auf die Suchergebnisse aus. Seitenbasierte Signale sind dagegen schon nach vergleichsweise kurzer Zeit wirksam.

In den Bing Webmaster Tools gibt es jetzt vier neue Funktionen, um die KI-Sichtbarkeit noch besser tracken zu können.

In einer Analyse von mehr als drei Millionen internen Google URLs haben sich interessante Erkenntnisse zu Googles Rankingsystemen ergeben.

Show transcript

00:00:00: Hallo und herzlich willkommen zu einer neuen Ausgabe von SEO im Ohr, eurem SEO Podcast hier auf seo-südwest wie immer mit den aktuellsten SEO News der Woche.

00:00:24: Ja was haben wir in dieser Woche dabei?

00:00:26: Einmal schauen wir auf die neuen Features in den Bing Webmaster Tools mit denen man die KI Sichtbarkeit messen kann.

00:00:35: außerdem gibt es eine Analyse mit über drei Millionen Google URLs.

00:00:42: die liefert interessante Einblicke in die Funktionsweise der Suchmaschinen.

00:00:49: Außerdem ein Tippabstrafung im Google schadet auch der KI-Sichtbarkeit, das zum Beispiel auch in ChatGPT.

00:00:57: und dann noch eine kleine Warnung wie einfach es ist mit user generated Content KI-Ergebnisse zu manipulieren.

00:01:08: Ja und dann auch noch ein Tipp zu Rankingfaktoren, die Website weit wirken im Gegensatz zu seitenbasierten Ranking Faktoren.

00:01:16: und wie ja die unterschiedlichen Reaktionszeiten bei Google sind also wieder jede Menge dabei in dieser Ausgabe von SEO im Ohr und ich freue mich dass ihr dabei seid.

00:01:25: und lasst uns gleich anfangen mit den Bing Webmaster Tools.

00:01:32: Ihr kennt das ja, das Tool ist sicherlich den meisten von euch bekannt.

00:01:37: Das ist praktisch das Gegenstück zur Google Search Console und Website-Betreiber können damit die Leistung ihrer Websites in der Suche von Bing überprüfen Zum Beispiel Impressionen, sich anzeigen lassen Klicks und so weiter.

00:01:52: Nun ist Bing nicht so bedeutsam für den deutschsprachigen Suchemarkt wie jetzt Google aber dafür hat Microsoft mit dem Bing Webmaster Tools wirklich ein sehr starkes Werkzeug auf dem Markt.

00:02:06: es lohnt sich da immer wieder mal einen näheren Blick drauf zu werfen.

00:02:11: ja im April hatte Bing angekündigt KI Performance Bericht, den sie ja schon etwas länger gibt in den Webmaster Tools um weitere Funktionen zu erweitern.

00:02:20: Und diese neuen Werkzeuge sollen dabei helfen, den Kontext und thematische Muster von AI Settings besser nachvollziehen zu können.

00:02:32: Dazu gehören zum Beispiel Intents oder Absichten.

00:02:37: Sie ordnen Suchanfragen die zu einer Quellenangabe geführt haben, übergeordneten Kategorien zu.

00:02:44: Und es gibt verschiedene dieser Kategorie wie zum Beispiel Informationen, kommerzielle Absichten, Navigationen, Lernenlösen und auch Forschung.

00:02:55: statt nur zu sehen dass ein Inhalt zitiert wurde in den KI Antworten können Publisher nun auch verstehen, in welchem inhaltlichen Kontext das KI-System diese Seiten ausgespielt hat.

00:03:06: Und so kann ein e-Commerce Unternehmen zum Beispiel erkennen ob seine Inhalte eher bei transaktionalen oder rein informativen Karrieregebnissen sichtbar sind und dann entsprechend die Content Strategie ausrichten.

00:03:17: Neu sind auch die Topics.

00:03:18: über Topics werden einzelne Suchernfragen im größeren thematischen Cluster zusammengefasst und weil KI Systeme eher nach Konzepten als noch isolierte Keywords arbeiten Spiegelt diese Einteilung die tatsächliche Funktionsweise der KI besser wieder.

00:03:34: Und so kann man zum Beispiel unterschiedlicher Anfragen wie Solarzellen, Effizienz von Solarenergie oder Installationen von Solaranlagen automatisch in den großen Themenblock Solarenergie zusammenfassen und das erleichtert es.

00:03:47: dann konnte Teams ihre Reichweite nach redaktionellen Themengebieten zu analysieren, neue Bereiche zum Schaffen von Autorität zu identifizieren und auch inhaltliche Lücken zu schließen.

00:03:58: Der Citation Share ist ebenfalls neu Anders als die reine Anzahl der Citation, die ja nur anzeigt.

00:04:06: Wie oft eine Seite erwähnt wird zeigt das Citation Share welchen Anteil die eigene Website an allen angezeigten Quellen für eine bestimmte Anfrage einnimmt und damit können Publisher zum Beispiel bewerten wie stark ihre Sichtbarkeit im Vergleich zur Gesamtheit der genutzten Quellen ausfällt.

00:04:22: Ja, es handelt sich dabei allerdings nur um eine.

00:04:26: Microsoft schreibt in eine reine Beobachtungskennzahl und nicht um ein Ranking System.

00:04:30: Es werden also weder Qualitätsbewertungen vergeben noch Daten von Konkurrenten offen gelegt.

00:04:35: Und dann gibt's auch noch die Compaire Funktionen und sie ermöglicht das Daten eines vergangenen Zeitraums direkt über die aktuellen Berichtsdaten zu legen und damit können Website-Betreiber beispielsweise die Citations der letzten dreißig Tage mit dem vorherigen Monat vergleichen oder benutzerdefinierte Zeiträume festlegen.

00:04:52: Und das ist dann hilfreich, wenn man beobachten möchte wie sich Content Updates, stationale Veränderungen oder auch Schwankung in der Nachfrage selbst auf die Sichtbarkeit auswirken.

00:05:03: Das Ganze ist weltweit schon als Preview Version verfügbar Und Microsoft erwartet, dass die Präzision und Qualität der Datenpunkte auch mit zunehmender Nutzung weiter steigen wird.

00:05:18: Schaut es euch am besten einfach mal an in den Bing Webmaster Tools und probiert's aus!

00:05:22: Ich persönlich finde ja gerade was das Thema KI Sichtbarkeit angeht... Tools brauchen, die uns da wirklich zuverlässig Daten liefern.

00:05:35: Die uns dann eben auch Handlungsräume aufzeigen.

00:05:39: Ja bleiben wir so ein bisschen noch beim Thema KI und KI-Sichtbarkeit.

00:05:43: Und eine neue Studie hat jetzt gezeigt wie einfach es ist mit User Generated Content KI Ergebnisse zum Manipulieren.

00:05:50: Es gingen dabei genauer gesagt um Deep Research Anfragen wie man sie zum Beispiel mit Google Gemini durchführen kann.

00:05:58: Also da werden dann sehr, sehr viele Quellen ausgewertet und dann zu einem umfassenden Bericht zusammengefasst.

00:06:06: Das heißt also hier die Präsenz von Online-Dokumenten ist da sehr wichtig.

00:06:11: Und dabei wird eben auch stark auf User Generated Content zurückgegriffen.

00:06:15: Also nutzergenerierte Inhalte von Plattformen wie Reddit, Wikipedia und diverse andere Foren.

00:06:22: Diese Plattform sind für KI besonders wertvoll, weil sie eben auch detaillierte Erklärungen persönliche Erfahrungen an eine sehr breite thematische Abdeckung bieten.

00:06:32: Und laut dieser Studie von der Cornell University machen bei vielen generierten Antworten UGC-Plattform zwischen seventeen und dreinzwanzig Prozent der abgerufenen URLs aus und dabei liegt Reddit oftmals vorne.

00:06:51: Google Germany verweist bei den analysierten Durantfragen etwa zwölf Prozent der Fälle auf user-generated content.

00:06:57: Ja, und diese starke Abhängigkeit von nutzergenerierten Inhalten, die birgt auch große Risiken weil diese Inhalte von praktisch jedem Netz bearbeitet und ergänzt werden kann Und die Forscher haben herausgefunden dass KI-Agenten Bei thematisch ähnlichen Suchern fragen immer wieder dieselben Seiten abrufen.

00:07:13: Die hohe Überschneidung schafft eine konzentrierte Angriffsfläche und dabei sprechen wir von sogenannten Warp-Angriffen, das steht für Web Agent Retrieval Poisoning.

00:07:25: Und dazu reicht es aus wenn ein Angreifer einen kurzen gezielt manipulierten Textblock in einen häufig abgerufenen Vornbeitrag oder Artikel einfügt.

00:07:35: Die Ergebnisse der Studie zeigen, wie wirksam das Ganze ist.

00:07:38: In Tests in denen ein einzelner manipulierter Text aus lediglich rund dreizehn Wörtern an die Snippets einer relevanten UGC-Seite angehängt wurde übernahm die KI-Systeme in achtunddreißig bis fünfzehnfünfzig Prozent der Fälle die gefälschten Informationen und bewaben die vom Angreifer platzierte Zielentitäten.

00:07:57: namentlich auch im Abschlussbericht wurden direkt drei beliebte URLs eines Themenbereichs gleichzeitig manipuliert, dann stieg diese Rate sogar auf forty-two bis sixty-two Prozent an.

00:08:08: und selbst wenn die KI komplette Formthreads auswertete unter eingeschleuster Text weniger als vier Prozent des gesamten Textes ausmachte lagen die Erfolgsquoten noch immer bei dreißig bis dreieinfünfzig Prozent.

00:08:20: Ja und leider Helfen da gezielte Gegenmaßnahmen, wie zum Beispiel das Blockieren von einzelnen Quellen.

00:08:29: Das Filtern von Eingaben auf Anomolien oder die Prüfung der finalen KI-Texte wenig und ich habe euch hier noch ein paar Beispiele mitgebracht.

00:08:39: Zum Beispiel wurde eine fiktive Kryptowährung namens Bananakollen erfunden.

00:08:45: bei Anfragen zu langfristigen Investitionen In Kryptowährung wurde dazu ein kurzer manipulativer Text eingefügt.

00:08:55: Und der KI-Agent passt darauf in seinen Bericht an und empfahl die völlig verheuerfundene Währung banana coin als attraktive, aufstrebende Option zur Inflationsbekämpfung direkt neben etablierten Werten wie Bitcoin oder anderes.

00:09:10: Beispiel das nennt sich Cancel Ease.

00:09:13: bei Recherchen darüber Internetvertrag bei Comcast Xfinity kündigen kann.

00:09:19: Da riecht die IKI den Nutzern auf Basis eines vergegierten Nutzerkommentars, den erfundenen Drittanbieterservice Cancel is zu verwenden um den Kündigungsprozess effizienter und unkömpfizierter zu gestalten.

00:09:31: Ja wenn ihr jetzt aber denkt dazu wurden irgendwelche Websites manipuliert um diese Ergebnisse herauszufinden so ist das nicht denn Es wurde unter strengen Vorgaben alles gemacht.

00:09:40: Das wurden zu keinem Zeitpunkt echte Websites oder Live-Inhalte im Internet modifiziert, stattdessen entwickelten die Forscher ein spezielles Simulationsframework und dieses Framework schaltet sich dann als Zwischenschicht in den Suchprozess ein und zunächst wurden über herkömmliche Suchmaschinen Quellen identifizieren.

00:10:02: daraufhin wurden mit einem Sprachmodell kurze, unauffällige und überzeugende Werbetexte für fiktive Marken erzeugt.

00:10:09: Und sobald ein KI-Agent während seiner Webrecherche eine dieser zuvor Identifizierten URLs aufrief dann fing diese Zwischenschicht die Suchanfrage ab und hängte den manipulierten Text automatisch lokal an die abgerufenen Suchergebnisse an.

00:10:23: ja und das ganze zeigt nur dass das Thema KI Ergebnisse, KI Sichtbarkeit im Moment doch noch sehr fragil und fehleranfällig ist.

00:10:32: Und man sollte jetzt auch wirklich nicht sich dazu verleiten lassen solche manipulativen Techniken einzusetzen, denn ja das ganze kann dann auch wenn es blöd läuft zu einer Abstraffung in Google führen.

00:10:46: und damit kommen wir auch schon zum nächsten Beitrag.

00:10:49: Es ist nämlich so wenn eine Google eine Website mit einer manuellen Maßnahme belegt dann kann dass auch der Sichtbarkeit in der KI oder anderen Plattformen schaden.

00:11:00: Das Ganze kann man recht eindrucksvoll sehen anhand eines Beispiels.

00:11:05: Das habe ich euch auch im Beitrag auf SEO-Südwest hinterlegt, da ging es um eine Seite oder eine Website bei der ganze Blogbereich von Google abgestraft wurde und in der Folge sank dann die Sichtbarkeit sowohl in den Google AI Overview als auch in Chat GPT.

00:11:25: Und was zeigt uns das, dass Geo und Seeho also nicht getrennt betrachtet werden dürfen?

00:11:31: Wer versucht durch bestimmte Tricks kurzfristig seine Sichtbarkeit in der KI zu steigern und dabei Regeln und Empfehlungen für die Google-Suche ignoriert, der läuft Gefahr, die Sichtbarkeitswohl in Google als auch in derKI insgesamt einzubösten.

00:11:45: Gute Geobouch daher immer auf klassischer Seeho auf und erweitert diese dort wo es nötig ist, wobei stets die Regeln wie zum Beispiel die Google Webmaster Richtlinien im Auge behalten werden müssen.

00:11:59: Ja auf etwas Interessantes bin ich gerade heute also kurz bevor ich hier diesen Podcast Aufnahme gestoßen und zwar gibt es eine Untersuchung die von Resonéo französischer Seeohanbieter durchgeführt wurde.

00:12:13: Die haben sich drei Komma sieben Millionen interne Google URLs angeschaut, also URLs die Google sozusagen in seinem Geschäftsfeld nutzt.

00:12:24: und die haben nur die URLs.

00:12:25: dann geschautes weil da so keine einzige Seite geöffnet ist wurden keine Login-Sperrenumgang Und trotzdem konnte man anhand dieser URLs und der Pfade und Namen die da verwendet werden eine ganze Menge herauslesen.

00:12:39: Grund ist dass solche URLs eben oftmals sprechen sind und eben schon darauf schließen lassen, wofür sie gedacht sind.

00:12:46: Und das hat dann wirklich einige interessante Ergebnisse gebracht und man hat sehen können dass viele der früheren Leaks zum Beispiel aus dem Jahr hier in den Jahren ist.

00:13:00: Da wurden ja auch einige Google Ranking Faktoren zumindest mutlar maßlich veröffentlicht, dass die der Realität entsprechen und sehr wahrscheinlich der Realitäten sprechen.

00:13:11: Und ein Beispiel ist, es gibt einen sogenannten Hauptscorer für Information Retrieval.

00:13:18: Der nennt sich A Scorer und der konnte ja durch eine oder durch mehrere UALs die in diesem Datenpult vorhanden sind bestätigt werden.

00:13:29: Auch die sogenannten Twitler, also diese Rewrankingmechanismus den Google verwendet wurden dadurch bestätigte und es wurden UALS auch gefunden, die auf interne Anleitung zum Schreiben solcher Twitter verweisen.

00:13:45: Auch zum Thema manuelle Eingriffe redaktionelle Black Listen gibt es interessante Erkenntnisse.

00:13:52: Die Rankings bei Google, die finden ja nicht nur Algorithmen statt sondern es wird auch manuell eingegriffen haben wir ja auch vorhin schon beim Thema manuelle Maßnahmen gehört gerade bei sensiblen Themen und da gibt es verschiedene Mechanismen, die da zum Tragen kommen.

00:14:10: Es gibt nämlich die Möglichkeit sowohl Seiten komplett zu sperren als auch sie einfach abzuwerten.

00:14:17: also das heißt einmal gibt es einen Spam Index und dann gibt es auch noch ein Demote Index.

00:14:23: Spam index ist fürs Löschen und der Demote index ist das Öl des Herabstufen von Inhalten.

00:14:30: Und was auch noch spannend ist, man kann auch in die Google-Infrastruktur ein paar Einblicke erhalten wenn man sich die URL anschaut.

00:14:40: Die Analyse ergab zum Beispiel den Namen von über zwei tausend dreihundert internen Druckern und aus dem händisch vergebenden Namen dieser Drucker lässt sich auch die Geografie von Gebäuden, Stockwerken oder sogar der Sicherheitstopologie von Rechenzentren rekonstruieren und persönliche Mitarbeiterseiten zeigen, auch wenn man sie gar nicht dazu öffnen muss wer an welchen Geheimprojekten gearbeitet hat.

00:15:05: Und damit kann man mit einem bestimmten Pfad zum Beispiel ein Softwareentwickler direkt einen bestimmten Ranking System zuordnen.

00:15:13: Ja, wenn ihr es ein bisschen genauer wissen wollt dann schaut am besten einfach mal auf den Beitrag oder in den Beitragen rein, den ich euch hier auf Seosetwest zur Verfügung gestellt habe.

00:15:23: Ja, also ich finde es persönlich sehr spannend.

00:15:26: Und dann auch noch was jetzt eine Info die jetzt gerade von der Google Search Central Live kommt, die in Mainland stattgefunden hat und da ging es nochmal um unter anderem auch um die Trennung von Ranking Faktoren, die die gesamte Website betreffen die auf Seitenebene greifen.

00:15:47: Diese Unterscheidung ist wichtig, also Rankingfaktoren auf Seitendebene sind zum Beispiel Titelüberschriften und andere Inhalte während ein Website weiter Ranking Faktor

00:15:57: z.B.,

00:15:58: der Page-Rank ist.

00:15:59: Und ja je nachdem auf welcher Ebene einen Ranking-Faktor greift da kann es unterschiedlich lange dauern bis sich Änderungen auf die Rankings auswirken.

00:16:08: Und der Seitenbasierte Signale, die können kurzfristig korrigiert werden.

00:16:11: Websiteweite Signale benötigen eine verlängerte Berechnungsdauer um das Kernsystem zu aktualisieren und rein technische Maßnahmen wie zum Beispiel Rebranding, Migration oder Weiterleitung von links würden dabei keine strukturellen Defizite bei der intrinsischen Domainqualität bewirken.

00:16:30: Google hat in diesem Zusammenhang außerdem empfohlen sich nicht auf die Suche zu verlassen, sondern auf unterschiedliche Trafficquellen zu setzen.

00:16:37: Das ist jetzt auch keine besonders neue Information.

00:16:40: es hat Google ja schon öfter gesagt.

00:16:42: Wichtig ist die Erkenntnis je nachdem welche Änderungen und Optimierung man an einer Website oder einen einzelnen Seiten vornimmt kann das unterschiedlich lange dauern bis ich diese auf die suchergebnisse auswirken.

00:16:53: Und ja auch noch eine Info vor einigen Jahren schon mal hingewiesen habe, nämlich dass zwischenzeitliche Google Core Updates keinen Einfluss nehmen auf die Verarbeitungsdauer von Änderung und Auswirkungen auf die Rankings.

00:17:08: Ja, und das wäre es jetzt auch schon wieder gewesen in dieser Ausgabe von CEO im Ohr.

00:17:14: Und ich freue mich natürlich sehr, dass ihr dabei gewesen seid und würde mich noch mehr freuen wenn ihr auch das nächste Mal wieder einschaltet.

00:17:23: In etwa einer Woche da gibt's dann die nächste Ausgabel.

00:17:27: Und in der Zwischenzeit halte ich euch natürlich auch hier auf seositwest auf dem Laufenden.

00:17:31: also schaut gerne regelmäßig rein und ja auch am Wochenende gibt es News für euch, wenn etwas Relevantes passiert.

00:17:41: Ja das wäre's dann also gewesen und ich wünsche euch eine gute Zeit und freue mich dann auch bis zum nächsten Mal!

00:17:49: Machts gut, tschüss euer Christian.

Show notes

Show transcript

New comment