Back home

Die Webkompatibilität für Agenten wird von einer Add-on-Funktion zu einer Standardanforderung

Öffentliche Websites müssen für Menschen, Crawler und Agenten lesbar, überprüfbar und nachvollziehbar sein

Ein normaler Inhalt wird im Browser angezeigt, kann jedoch bei der Übergabe an das Agentenprogramm häufig nicht vollständig gelesen werden. Nur weil die Seite geöffnet werden kann, heißt das nicht, dass die Seite auch wirklich genutzt werden kann; Nur weil es von Menschen gesehen werden kann, bedeutet das nicht, dass es von Maschinen stabil gelesen, überprüft und verfolgt werden kann.

Früher wurde diese Angelegenheit als Nebensache betrachtet, etwa „die Sitemap ausfüllen“ oder „einige strukturierte Daten zur Artikelseite hinzufügen“. Es ist keine Ecke mehr. Sobald eine öffentliche Website KI-Crawlern, automatisiertem Abruf und agentenbasierten Workflows ausgesetzt ist, sind die kompatiblen Objekte nicht mehr nur Browser und Suchmaschinen, sondern auch eine Art Client, der Seiten basierend auf der Semantik aufteilen, basierend auf Links springen und die Ausführung basierend auf dem Status fortsetzen kann. Wenn eine Seite nur für menschliche Leser geeignet ist, aber für solche Kunden voller Fallstricke steckt, sieht sie wie eine Website mit unvollständiger Kompatibilität aus.

Nur weil die Seite geöffnet werden kann, heißt das nicht, dass die Seite gelesen werden kann.

Das erste Problem ist meist nicht die Qualität des Inhalts, sondern die Art und Weise, wie der Inhalt ausgegeben wird.

Wenn eine Seite den Textkörper in das clientseitige Rendering einbettet, Schlüsselfelder in Akkordeonfeldern verbirgt, die Paginierung in einen Bildlauf ohne explizite URLs umwandelt und Tabellen in Bilder umwandelt, kann sich das Agentenprogramm nur auf Vermutungen verlassen. Für Menschen kann eine falsche Vermutung bedeuten, dass ein Absatz übersehen wird; Bei einer Maschine kann eine falsche Vermutung dazu führen, dass nachfolgende Aktionen in die Irre gehen und ein paar weitere Schritte in der Zukunft einfach mit dem falschen Verständnis fortgesetzt werden.

Diese Art von Problem tritt besonders deutlich auf Dokumentseiten und Inhaltsseiten auf. Menschliche Leser folgen der visuellen Ebene und vervollständigen den Kontext selbst; Agenten nicht. Was der Agent sieht, ist das DOM, die Header-Hierarchie, Linkbeziehungen, Formularsteuerelemente, Statuscodes und crawlbarer Text. Wenn der Haupttext von diesen Grundsignalen getrennt wird, erscheint die Seite in einem unangenehmen Zustand: Sie sieht modern aus, ist aber tatsächlich instabil.

Bei der Migration von Single-Page-Anwendungen wurde diese Ebene in der Vergangenheit oft als erstes freigelegt. Der erste Bildschirm erscheint und die Interaktion ist möglich, aber die Maschine erfasst die Shell und der eigentliche Text erscheint erst, wenn das Skript fertig ist. In Verbindung mit verzögertem Laden, unendlichem Scrollen und verschiedenen Designs zum Erweitern und Anzeigen wird die Inhaltsseite zu einer Reihe zufälliger Ereignisse. Für Browserbenutzer ist es nur eine leichte Verlangsamung; Für Agenten handelt es sich um eine Kette unzuverlässiger Einträge.

Was die Maschine will, ist ein stabiler Einstieg, kein visueller Inhalt.

Wenn Sie die Website „agentenbereit“ machen, wird im Wesentlichen eine Kompatibilitätsebene hinzugefügt, und nicht ein neuer Trick.

Der wertvollste Aspekt dieser Kompatibilitätsebene besteht nicht darin, die Seite „wie für Maschinen aussehen zu lassen“, sondern darin, die grundlegendsten Fakten klar anzugeben: um welche Seite es sich handelt, wo sich der Text befindet, wie der aktuelle Status ist, ob weiter gesprungen werden kann und was zurückgegeben werden soll, wenn es fehlschlägt. Solange diese Fakten instabil sind, werden Agenten die Grenzen immer wieder testen.

Die Dinge, mit denen man sich auf Content-Websites zuerst befassen sollte, sind in der Regel die folgenden:

  • Der Text muss direkt über den HTML-Code zugänglich sein, ohne auf Skripte angewiesen zu sein, um ihn zu erraten
  • Die Titelhierarchie sollte stabil sein und nicht zulassen, dass der visuelle Stil die semantische Struktur ersetzt. – Paginierung, Filterung und Suchergebnisse müssen über gemeinsam nutzbare URLs verfügen und dürfen nicht nur im Front-End-Status vorhanden sein
  • Bilder, Tabellen und Codeblöcke müssen lesbaren Alternativtext oder Originaltext enthalten
  • Die grundlegenden Exporte von Canonical, Sitemap und Feed sollten sauber sein und nicht mit einer Reihe temporärer Parameter vermischt werden.

Das mag wie Klischees klingen, aber ihre Bedeutung hat sich inzwischen geändert. In der Vergangenheit wurden diese aus Suchmaschinen- und Zugänglichkeitsgründen hinzugefügt; Jetzt werden diese hinzugefügt, damit der Agent Inhalte stabil lokalisieren, die Beziehung zwischen Seiten bestimmen und ohne manuelle Eingabeaufforderungen mit dem nächsten Schritt fortfahren kann. Sie weisen alle auf dasselbe hin: Die Seite muss als eindeutige Eingabe eines anderen Clients und nicht als einmaliges visuelles Ergebnis behandelt werden.

Aus diesem Grund hilft das „Hinzufügen einer KI-Schaltfläche“ nicht wirklich. Die Schaltfläche selbst macht die Seite nicht konsumierbarer. Im besten Fall wird eine Aktion einfach in einen neuen Eintrag eingeschlossen. Wenn die unterste Ebene immer noch auf visuelles Layout und temporären Status angewiesen ist, um das Verständnis aufrechtzuerhalten, verliert das Agentenprogramm beim Aktualisieren, Springen, Zurücksetzen und Berechtigungsänderungen immer noch die Kontrolle.

Die Interaktion muss die Aktion abschließen und darf nicht nur bei der Eingabeaufforderung anhalten

Wenn die Seite nur zur Anzeige von Inhalten dient, sind Kompatibilitätsprobleme relativ einfach zu lösen. Wenn es um die Interaktions- und Bedienebene geht, wird das Problem noch schwieriger.

Was ein Agent wirklich braucht, ist nicht „fast genug“, sondern klare Handlungsgrenzen. Senden, bestätigen, widerrufen, herunterladen, abonnieren, springen und exportieren. Diese Aktionen sollten vorzugsweise klare Vorbedingungen, Fehlerrückmeldungen und nachvollziehbare Ergebnisse haben. Solange Aktionen mit einer Reihe von Pop-ups, Eingabeaufforderungen und sekundären Bestätigungen vermischt werden, bleibt die Maschine immer wieder an der gleichen Stelle stecken.

Hier beginnt der Unterschied zwischen öffentlichen Websites und internen Systemen groß zu werden. Öffentliche Websites sind mit der Zugriffsmöglichkeit konfrontiert, während interne Systeme mit Berechtigungen und Risikokontrolle konfrontiert sind. Ersteres eignet sich besser zur Stabilisierung der Informationsstruktur und Handlungssemantik, sodass externe Clients Umwege vermeiden können; Letzteres sollte die Grenzen nicht lockern, um „kompatibel mit Agenten“ zu sein, insbesondere wenn es um Gelder, Veröffentlichungen, Löschungen und Berechtigungsänderungen geht. Wir müssen immer noch konservativ sein, wo wir konservativ sein sollten.

Es geht also nicht darum, alle Webseiten in Maschinenschnittstellen umzuwandeln. Ein realistischerer Ansatz besteht darin, die Seiten, die ursprünglich für den externen Konsum gedacht waren, in stabile, überprüfbare und wiederholbare Eingänge umzuwandeln. Artikelseiten, Dokumentationsseiten, Wissensdatenbanken, Hilfezentren, offene APIs und öffentliche Suchergebnisse sind die ersten, die betroffen sind und die ersten Vorteile sehen.

Dieser Kompatibilitätsgrad hat klare Grenzen

Agent-Ready ist kein einheitliches Ziel.

Das Backend eines vollständigen Intranets, das Geschäftssystem mit starker Berechtigungskontrolle, die Aktivitätsseite mit kurzem Lebenszyklus und die Content-Station für den öffentlichen Gebrauch sind nicht auf dem gleichen Niveau. Ersteres legt mehr Wert auf Kontrolle, während letzteres mehr Wert auf Lesbarkeit, Indexierbarkeit und Rückverfolgbarkeit legt. Wenn diese beiden Arten von Systemen auf die gleichen Standards gezwungen werden, die „Maschinen nutzbar machen“, werden die Verwaltungskosten letztendlich nur steigen.

Aber es ist schwer, weiterhin so zu tun, als hätte sich auf der öffentlichen Website nichts geändert. KI-Crawler werden Seiten zunehmend direkt lesen und Agenten-Workflows werden zunehmend auf strukturierten Inhalten und stabilen Aktionen basieren. Wenn eine Seite immer noch an der Idee festhält: „Es reicht, dass die Leute es sehen“, kommt es früher oder später zu Rissen in der Verteilung, dem Abruf, der Archivierung und der automatisierten Integration von Inhalten.

Diese Änderung ähnelt also eher einem Kompatibilitäts-Upgrade. In der Vergangenheit musste das Frontend unterschiedliche Browser, unterschiedliche Bildschirme und unterschiedliche Netzwerke berücksichtigen; Jetzt muss auch ein Clienttyp in Betracht gezogen werden, der Seiten selbst teilen, Links selbst folgen und den Status selbst überprüfen kann. Mit dieser zusätzlichen Kompatibilitätsebene kann die Site wirklich eine neue Standardanforderung erfüllen: Sie muss nicht nur sichtbar sein, sondern auch stabil genutzt werden.

FAQ

What to read next

Related

Continue reading