Back home

Zgodność sieciowa dla agentów zmienia się z funkcji dodatkowej na wymaganie domyślne

Strony publiczne muszą być czytelne, weryfikowalne i identyfikowalne dla ludzi, robotów indeksujących i agentów

W przeglądarce pojawia się normalny fragment treści, ale często nie można go w całości odczytać po przekazaniu do programu agenta. To, że stronę można otworzyć, nie oznacza, że ​​naprawdę można ją skonsumować; to, że ludzie mogą go zobaczyć, nie oznacza, że ​​może być stabilnie odczytywany, weryfikowany i śledzony przez maszyny.

Kiedyś tę kwestię traktowano jako kwestię poboczną, taką jak „wypełnij mapę witryny” lub „dodaj uporządkowane dane do strony artykułu”. To już nie jest kąt. Gdy witryna publiczna napotyka roboty AI, automatyczne pobieranie i przepływy pracy oparte na agentach, kompatybilnymi obiektami nie są już tylko przeglądarki i wyszukiwarki, ale także typ klienta, który może dzielić strony na podstawie semantyki, przeskakiwać na podstawie linków i kontynuować wykonywanie na podstawie statusu. Jeśli strona jest przyjazna tylko dla ludzkich czytelników, ale pełna pułapek dla takich klientów, zacznie wyglądać jak witryna z niepełną kompatybilnością.

To, że stronę można otworzyć, nie oznacza, że ​​można ją przeczytać.

Pierwszym problemem zwykle nie jest jakość treści, ale sposób, w jaki jest ona prezentowana.

Jeśli strona osadza tekst podstawowy w renderowaniu po stronie klienta, ukrywa kluczowe pola w panelach harmonijkowych, zamienia paginację w przepływ przewijania bez wyraźnych adresów URL i renderuje tabele w obrazy, program agenta może polegać jedynie na domysłach. W przypadku ludzi błędne przypuszczenie może oznaczać pominięcie akapitu; w przypadku maszyny błędne przypuszczenie może spowodować, że późniejsze działania zejdą na manowce, a kilka kolejnych kroków w przyszłości będzie po prostu kontynuowaniem błędnego zrozumienia.

Ten typ problemu jest szczególnie widoczny w witrynach z dokumentami i witrynami z zawartością. Ludzcy czytelnicy podążają za warstwą wizualną i sami uzupełniają kontekst; agenci nie. Agent widzi DOM, hierarchię nagłówków, relacje łączy, kontrolki formularzy, kody stanu i tekst, który można przeszukać. Jeśli główny tekst zostanie odłączony od tych podstawowych sygnałów, strona pojawi się w niezręcznym stanie: wygląda nowocześnie, ale w rzeczywistości jest niestabilna.

W przeszłości podczas migracji aplikacji jednostronicowych ta warstwa była często ujawniana jako pierwsza. Pojawia się pierwszy ekran i interakcja jest możliwa, ale maszyna przechwytuje powłokę, a prawdziwy tekst pojawia się dopiero po zakończeniu skryptu. W połączeniu z leniwym ładowaniem, nieskończonym przewijaniem i różnymi projektami „rozwiń i wyświetl”, strona z treścią stanie się serią przypadkowych zdarzeń. Dla użytkowników przeglądarek jest to po prostu lekkie spowolnienie; dla agentów jest to łańcuch niewiarygodnych wpisów.

Maszyna chce stabilnego wejścia, a nie treści wizualnych.

Przygotowanie witryny do pracy z agentem zasadniczo polega na dodaniu warstwy kompatybilności, a nie na dodaniu nowej sztuczki.

Najcenniejszym aspektem tej warstwy kompatybilności nie jest to, aby strona „wyglądała tak, jakby była przeznaczona dla maszyn”, ale jasne określenie najbardziej podstawowych faktów: jaka to jest strona, gdzie znajduje się tekst, jaki jest aktualny status, czy może dalej skakać i co powinno zostać zwrócone w przypadku niepowodzenia. Dopóki te fakty są niestabilne, agenci będą wielokrotnie testować granice.

Najbardziej wartościowymi kwestiami, którymi należy się zająć w pierwszej kolejności w witrynach z treścią, są zazwyczaj następujące kwestie:

  • Tekst musi być bezpośrednio dostępny z poziomu kodu HTML, bez polegania na skryptach do jego odgadnięcia
  • Hierarchia tytułów powinna być stabilna i nie pozwalać, aby styl wizualny zastępował strukturę semantyczną.
  • Paginacja, filtrowanie i wyniki wyszukiwania muszą mieć udostępniane adresy URL, a nie istnieć tylko w stanie frontonu
  • Obrazy, tabele i bloki kodu muszą mieć czytelny tekst alternatywny lub tekst oryginalny
  • Podstawowy eksport plików kanonicznych, mapy witryny i kanału powinien być czysty i nie powinien być pomieszany z mnóstwem parametrów tymczasowych.

Może to brzmieć jak banały, ale ich znaczenie uległo zmianie. W przeszłości dodawano je ze względu na wyszukiwarki i dostępność; teraz są one dodawane, aby umożliwić agentowi stabilne lokalizowanie treści, określanie relacji między stronami i przejście do następnego kroku bez ręcznych monitów. Wszystkie wskazują na to samo: stronę należy traktować jako konkretny wkład innego klienta, a nie jednorazowy efekt wizualny.

Dlatego „dodanie przycisku AI” tak naprawdę nie pomaga. Sam przycisk nie czyni strony bardziej konsumpcyjną. W najlepszym przypadku po prostu otacza akcję nowym wpisem. Jeśli dolna warstwa w celu utrzymania zrozumienia nadal opiera się na układzie wizualnym i stanie tymczasowym, program agenta nadal będzie tracił przyczepność podczas odświeżania, przeskakiwania, wycofywania i zmiany uprawnień.

Interakcja musi zakończyć akcję, a nie tylko zatrzymać się na monicie

Jeśli strona służy wyłącznie do wyświetlania treści, problemy ze zgodnością są stosunkowo łatwe do rozwiązania. Jeśli chodzi o poziom interakcji i obsługi, problem staje się jeszcze trudniejszy.

To, czego tak naprawdę potrzebuje agent, to nie „prawie tyle”, ale jasne granice działania. Prześlij, potwierdź, unieważnij, pobierz, subskrybuj, przeskocz i eksportuj. Działania te powinny mieć jasne warunki wstępne, zwroty błędów i możliwe do prześledzenia wyniki. Dopóki działania będą połączone z mnóstwem wyskakujących okienek, monitów i wtórnych potwierdzeń, maszyna będzie ciągle blokować się w tym samym miejscu.

W tym miejscu różnica między witrynami publicznymi a systemami wewnętrznymi zaczyna być duża. Witryny publiczne muszą sprostać wymaganiom użytkowym, podczas gdy systemy wewnętrzne wymagają uprawnień i kontroli ryzyka. To pierwsze jest bardziej odpowiednie do stabilizacji struktury informacji i semantyki działań, tak aby klienci zewnętrzni mogli uniknąć objazdów; ten ostatni nie powinien rozluźniać granic, aby być „kompatybilnym z agentami”, zwłaszcza gdy w grę wchodzą fundusze, publikacja, usuwanie i zmiany pozwoleń. Nadal musimy być konserwatywni tam, gdzie powinniśmy być konserwatywni.

Nie chodzi więc o przekształcenie wszystkich stron internetowych w interfejsy maszynowe. Bardziej realistycznym podejściem jest przekształcenie stron pierwotnie przeznaczonych do użytku zewnętrznego w stabilne, weryfikowalne i odtwarzalne wejścia. Strony z artykułami, strony dokumentacji, bazy wiedzy, centra pomocy, otwarte interfejsy API i publiczne wyniki wyszukiwania są pierwszymi dotkniętymi zmianami i pierwszymi, które dostrzegają korzyści.

Ten poziom zgodności ma wyraźne granice

Gotowość do działania agenta nie jest celem uniwersalnym.

Zaplecze kompletnego intranetu, system biznesowy z silną kontrolą uprawnień, strona z działaniami o krótkim cyklu życia i stacja treści do użytku publicznego nie są na tym samym poziomie. Temu pierwszemu zależy bardziej na kontroli, drugiemu na czytelności, indeksowalności i identyfikowalności. Wtłaczanie tych dwóch typów systemów w ten sam zestaw standardów, które „sprawiają, że maszyny stają się użyteczne”, ostatecznie tylko zwiększy koszty zarządzania.

Trudno jednak dalej udawać, że na stronie publicznej nic się nie zmieniło. Roboty AI w coraz większym stopniu będą bezpośrednio czytać strony, a przepływy pracy agentów będą w coraz większym stopniu opierać się na uporządkowanej treści i stabilnych działaniach. Jeśli witryna nadal będzie trzymać się idei „wystarczy, aby ludzie ją zobaczyli”, prędzej czy później pojawią się pęknięcia w dystrybucji treści, wyszukiwaniu, archiwizowaniu i automatycznej integracji.

Zatem ta zmiana bardziej przypomina aktualizację kompatybilności. W przeszłości interfejs użytkownika musiał uwzględniać różne przeglądarki, różne ekrany i różne sieci; teraz musi także wziąć pod uwagę typ klienta, który może samodzielnie dzielić strony, samodzielnie podążać za linkami i samodzielnie weryfikować status. Po dodaniu tej warstwy kompatybilności witryna może naprawdę spełnić nowe wymagania domyślne: musi być nie tylko widoczna, ale także stabilnie konsumowana.

FAQ

What to read next

Related

Continue reading