Google vs. KI-Spam: Ich find einiges ganz gut

Fick dich, Google: 555 Suchanfragen können nicht irren

Google begründet zu hassen sollte eine meiner Kernkompetenzen sein. Dass ich das aktuelle Blutbad in Sachen Spam/Core-Update allerliebst finde und das Web dadurch besser wird, fühlt sich beim Hinschreiben folglich ein bisschen kantenkönigmäßig an. Kurz eine Betrachtung des Istzustands und eine Eskalation in Richtung der Debatte „wir brauchen alternative Suchmaschinen“ bzw. „wir brauchen Alternativen zu Suchmaschinen“ und „Wie organisieren wir Weltwissen in einer KI-verseuchten Dystopie von durchgeknallten Techbros“.

Google geht grade mit sehr grobem Besen gegen Spamseiten vor und dafür hab ich ein paar Sensoren. Einer der gröberen Sorte ist die Kommentarsektion bei SER, wo ich durchgehend das Gefühl habe, wer da winselt, wie Scheiße Google ihre Seiten einrankt, ist in 95% der Fälle ein Spammer vor dem Herrn (und häufig ein Arschloch). Ein sehr spezifischer Sensor ist krankomat.de, eine KI-Spamseite zu Gesundheitsthemen, die mir mal über den Weg lief und deren Weg in die Unauffindbarkeit ich seitdem mit einem gewissen Vergnügen verfolge.

KI-Spamscheiße hat noch Luft nach unten

KI-Spamscheiße hat noch Luft nach unten

(Kontext: durchgehend generierter Scheiß nach immergleichem Muster, Monetarisierung aus der Hölle, Fake-Autor mit lächerlich hohem Textoutput, Impressum in Kamerun, you name it.)

Selbst auf Linkedin finden sich schöne Dinge

Selbst auf Linkedin finden sich schöne Dinge

Dann noch Zufallshinweise wie Florian auf Linkedin, wo der Zerfall schon im letzten Jahr einschlug:

Ich mag mich den „Zurecht, kill it with fire“-Kommentaren dort explizit anschließen und hab kein Verständnis für jegliches „Google ist da aber sehr böse, das dürfen sie nicht/wir brauchen genau deshalb was anderes“. Google macht KI-Spamseiten in großem Stil platt, das ist auch gut so und macht das Web besser.

Mit einer großen Keule: denn tatsächlich sagt Google recht klipp und klar an, dass LLM-Scheiße nichts taugt. Wenn KI-generierter Content irgendwo nicht deklariert auf einer Seite steht, läuft die ganze Seite Gefahr, als Müll eingestuft zu werden:

So stuft man undeklarierten KI-Content korrekt ein

So stuft man undeklarierten KI-Content korrekt ein

(Man bedenke: das ist eine Anleitung für einen menschlichen Quality Rater, der eine Seite einstufen soll. Der erkennt an den vorgestellten Indizien, dass die Seite teils KI-Content raushaut und soll deswegen die ganze Seite als Müll einstufen. Google hat dabei das Ziel, genau diese Einstufung einer Seite automatisch selbst vornehmen zu können.)

Was ist heutzutage alles reiner Spam?

Was ist heutzutage alles reiner Spam?

Dass ein paar Blitzbirnen jetzt einfach mehr KI-Spam auf ihre brennenden KI-Müllhaufen werfen, verwundert nicht, ebensowenig, dass seitens Google hier bereits gewarnt wird, dass das möglicherweise kontraproduktiv sein könnte.

Etwas zwischen Prognose, Hoffnung und Befürchtung: was Google hier macht, ist eine Erziehungsmaßnahme mit einer sehr dicken Keule. Der Vergleich mit Penguin 2012 mit seinen Link-Abstrafungen liegt sehr nahe, und im Nachgang schrieb ich 2014 einigermaßen begründet, dass durch die damalige Google-Ansage „Wir entscheiden ab sofort, ob ein Link gut(tm) oder boese(tm) ist und sagens euch aber nicht“ trotz der richtigen Intention das Netz kaputtgemacht wurde. Auch mit zehn Jahren Abstand denke ich, ja, scheint mir nach wie vor valide Kritik.

Warum Prognose, Hoffnung und Befürchtung? Dass das KI-Content-Blutbad kommt und groß wird, scheint mir weniger Prognose denn augenfällig. Dass das LLM-Müllfeuer damit massiv eingedämmt wird: hoffentlich. Bleibt die Befürchtung: das wird wieder mit einigen Kollateralschäden und den üblichen Misserfolgen (aka rankenden Spammern) einhergehen. Immerhin, wer mit einem „Ich hab aber nur hochwertige Links ohne sprechenden Anchor gekauft!“ kommt, wird seit einigen Jahren zurecht ausgelacht. Wer weint, mit seinem Content-Spinner-Amazonshop und Clickworker-Texten für drei Cent das Wort keine Affiliatekohle mehr zu machen, kriegt heutzutage wenig Mitleid (zurecht, zurecht!). Der Weg bis hierhin war kein leichter, bisweilen war er steinig und schwer, aber hey, hier sind wir und vielleicht lachen wir in ein paar Jahren über die Jammerlappen, die sich wundern, warum ihre drölfzig korrekturgelesenen LLM-Schleudern nicht in die Rankings einsteigen, obwohl die passenden KI-Bilder alle auf Adobe-lizensierten Quellmaterial generiert wurden.

Aber Hoffnung ist Mangel an Information, und ich stelle mir das alles einen Ticken schwieriger vor als in schlechten alten Zeiten. Grundsätzlich bin ich eh ein wenig frustriert, weil die Big Player grade Pest und Cholera zur Auswahl anbieten, allem Chancen-Blingbling zum Trotz: Google-FUD zu KI-generiertem Content vs. KI-FOMO der Techbros. The only winning move is not to play, aber auch das scheint mir nur eine schlecht getarnte Realitätsverweigerung.

Google Docs hat eine Meinung zu deinem Text

Google Docs hat eine Meinung zu deinem Text

Ironie dabei: Parallel treibt Google den KI-FOMO natürlich massiv mit voran. Und das ohne Rücksicht auf Verluste, denn tatsächlich ist Googles Vereinnahmung von anderer Leute Content für KI-Trainingsmodelle an einem Punkt angekommen, an dem der von mir erheblichst geschätzte Isotopp davor warnt, dass eine verdammte Textverarbeitung inzwischen eine Meinung zu dem Inhalt hat, die man mit ihr erstellt. Hint: das ist SCHLECHT. Das SOLLTE NIE PASSIEREN. Und ich fürchte, man muss da nicht nur bei Google Docs aufpassen, denn was MS grade in Office und mit Copilot ausrollt, ist genau dasselbe. (Bild nebenan: Sloan Spencer.)

Wo stehen wir demnach? KI-Output muss bei der Generierung aktuell massiv reglementiert werden, weil er ansonsten sehr schnell hochproblematisch wird. Selbst das funktioniert nur mäßig und vor allem sind die Ergebnisse in der Regel unoriginell. Der Bedarf an unoriginellem Content ist durchaus da, das ist also kein Genickbruch, aber sagen wir so, die Menschheit bringts kosmisch betrachtet nur bedingt weiter. Als aktueller Step folgt nun, bereits den Input zu reglementieren, ich befürchte erhebliche Nebenwirkungen und rechne nicht mit adäquat besseren Outputs.

Und nu? Wolken abschalten und wir bauen wieder unser eigenes Ding? Ich tu mich grade ein bisschen schwer mit der Kurve zum Schluss, aber im Fedi rennen mir grade wieder vermehrt die „neue Web-Infrastrukturen bauen!“-Überlegungen über den Weg und ich ertappe mich mit Sympathien.

Grundsätzlich find ich sowas immer schön und im Netz ist viel Platz für viele Nischen. Tatsächlich musste ich grade aber wieder lang, haha, googlen, bis ich marginalia.nu wiederfand, eine allerliebste Suchmaschine für kuratierten Web1.0-Content, über die ich vor ein paar Jahren meine Seminarmaterialien zum Theravadabuddhismus wiederfand, meinen persönlichen Blick über den Tellerrand zu Unizeiten selig. Skeptisch bin ich, weil ich nicht recht sehe, wie sowas skaliert und weil ich ein sehr rudimentäres Denken in Sachen „Organisation des Weltwissens“ pflege, das in zwei Kategorien zerfällt, die eine heißt Google und die andere Wikipedia. Das scheint mir eine zentrale Dichotomie zu sein, wo alles andere irgendwie in ein „das eine oder das andere, nur schlechter“ reinrutscht.

Beide versuchen meinem Eindruck nach, in letzter Zeit durchaus besser zu werden, die Rahmenbedingungen werden indessen widriger. Beide zusammen tun für mich eigentlich nach wie vor den Job gut, und was Drittes will mir bislang nicht begegnen. Insofern seh ich mich in der irgendwie eigenartigen Lage, beiden aktuell einfach ein, zwei Daumen zu drücken. Vor allem im Fall von Google bin ich nicht recht glücklich dabei, aber Glück ist halt auch nicht der Default, der einem in beliebigen Kontexten grundsätzlich angezeigt wird. Tja, shit.

Nachtrag: mspr0 erwähnte nebenan, aus ähnlich gelagerten Gründen seine Krassen Links als kuratierte Leseempfehlung ins Netz zu stellen, um so auch die Signallage für die Aggregtatoren zu verbessern. Weiter stupste er mich auf die höchst bedenkenswerte Sichtweise, die Dichotomie Google/Wikipedia vielloeicht eher als komplemet komplemär sich gegenseitig ergänzend zu betrachten, Kuratierung/Signale/Suchqualität/Ergebnisse/Kuratierung usw., und ich freu mich grade über ein „Oh, das mach ich weniger bewusst vielleicht auch schon ne Weile“, we all weave the web, es ist ein bisschen Nullerjahreoptimismus, ich begrüße das sehr und fühl mich grade ein wenig versöhnter mit der Welt.

Kategorie: Allgemein Tags: , , , , , . Permalink.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert