Back home

Веб-совместимость агентов переходит из дополнительной функции в требование по умолчанию.

Публичные сайты должны быть доступны для чтения, проверки и отслеживания людьми, сканерами и агентами.

Обычный фрагмент контента появляется в браузере, но часто не может быть прочитан полностью при передаче в программу-агент. Тот факт, что страницу можно открыть, не означает, что ее действительно можно использовать; то, что его могут видеть люди, не означает, что его могут стабильно читать, проверять и отслеживать машины.

Раньше этот вопрос рассматривался как второстепенный вопрос, вроде «заполнить карту сайта» или «добавить структурированные данные на страницу статьи». Это уже не угол. Как только общедоступный сайт сталкивается со сканерами искусственного интеллекта, автоматическим поиском и рабочими процессами на основе агентов, совместимыми объектами становятся не только браузеры и поисковые системы, но и тип клиента, который может разделять страницы на основе семантики, переходить на основе ссылок и продолжать выполнение в зависимости от статуса. Если страница дружелюбна только к читателям, но полна ловушек для таких клиентов, она начнет выглядеть как веб-сайт с неполной совместимостью.

Тот факт, что страницу можно открыть, не означает, что ее можно прочитать.

Первая проблема обычно заключается не в качестве контента, а в способе его вывода.

Если страница встраивает основной текст в рендеринг на стороне клиента, скрывает ключевые поля в панелях аккордеона, превращает нумерацию страниц в поток прокрутки без явных URL-адресов и отображает таблицы в изображения, программа-агент может полагаться только на догадки. Для людей неправильная догадка может означать, что абзац пропущен; для машины неправильное предположение может привести к тому, что последующие действия собьются с пути, и еще несколько шагов в будущем просто продолжат ошибочное понимание.

Проблемы такого типа особенно очевидны на сайтах документов и сайтах контента. Читатели-люди следуют за визуальным слоем и сами дополняют контекст; агенты этого не делают. Агент видит DOM, иерархию заголовков, связи ссылок, элементы управления формами, коды состояния и текст, доступный для сканирования. Если основной текст оторвать от этих основных сигналов, страница окажется в неловком состоянии: она выглядит современно, но на самом деле нестабильна.

Раньше при миграции одностраничных приложений этот уровень часто открывался первым. Появляется первый экран, и взаимодействие возможно, но машина захватывает оболочку, и настоящий текст не появляется, пока скрипт не завершится. В сочетании с ленивой загрузкой, бесконечной прокруткой и различными вариантами дизайна «развернуть и просмотреть» страница с контентом превратится в серию случайных событий. Для пользователей браузера это всего лишь небольшое замедление; для агентов это цепочка ненадежных записей.

Машине нужен стабильный вход, а не визуальный контент.

Сделать сайт «готовым к работе с агентом» — это, по сути, добавить уровень совместимости, а не добавить новый трюк.

Самый ценный аспект этого уровня совместимости — не сделать страницу «выглядящей как для машины», а четко указать самые основные факты: что это за страница, где находится текст, каков текущий статус, может ли она продолжать переходить и что следует возвращать в случае сбоя. Пока эти факты нестабильны, агенты будут неоднократно проверять границы.

Обычно на содержательных сайтах в первую очередь стоит разобраться со следующими вещами:

  • Текст должен быть доступен напрямую из HTML, без необходимости его угадывания скриптами.
  • Иерархия заголовков должна быть стабильной и не позволять визуальному стилю подменять смысловую структуру. – Пагинация, фильтрация и результаты поиска должны иметь общие URL-адреса, а не существовать только во внешнем состоянии.
  • Изображения, таблицы и блоки кода должны иметь читаемый альтернативный или исходный текст. – Базовый экспорт канонических файлов, карты сайта и фида должен быть чистым и не перемешанным с кучей временных параметров.

Возможно, это звучит как клише, но теперь их значение изменилось. Раньше они добавлялись ради поисковых систем и доступности; теперь они добавлены, чтобы позволить агенту стабильно находить контент, определять связь между страницами и переходить к следующему шагу без ручных подсказок. Все они указывают на одно и то же: страницу нужно рассматривать как определенный ввод со стороны другого клиента, а не как разовый визуальный результат.

Вот почему «добавление кнопки AI» на самом деле не помогает. Сама кнопка не делает страницу более потребляемой. В лучшем случае он просто переносит действие в новую запись. Если нижний уровень по-прежнему полагается на визуальное расположение и временное состояние для обеспечения понимания, программа агента все равно потеряет контроль при обновлении, переходе, откате назад и изменении разрешений.

Взаимодействие должно завершить действие, а не просто остановиться на приглашении

Если страница предназначена только для отображения контента, проблемы совместимости решить относительно легко. Когда дело доходит до уровня взаимодействия и эксплуатации, проблема становится еще сложнее.

На самом деле агенту нужно не «почти достаточно», а четкие границы действий. Отправка, подтверждение, отзыв, загрузка, подписка, переход и экспорт — эти действия предпочтительно должны иметь четкие предварительные условия, возвраты при сбоях и отслеживаемые результаты. Пока действия перемешаны с кучей всплывающих окон, подсказок и вторичных подтверждений, машина будет снова и снова застревать в одном и том же месте.

Именно здесь разница между общедоступными сайтами и внутренними системами начинает становиться большой. Публичные сайты сталкиваются с необходимостью использования, а внутренние системы сталкиваются с разрешениями и контролем рисков. Первый больше подходит для стабилизации информационной структуры и семантики действий, чтобы внешние клиенты могли избежать обходных путей; последний не должен ослаблять границы, чтобы быть «совместимым с агентами», особенно когда речь идет о финансировании, публикации, удалении и изменении разрешений. Нам по-прежнему приходится быть консервативными там, где мы должны быть консервативными.

Так что речь не идет о преобразовании всех веб-страниц в машинные интерфейсы. Более реалистичный подход — превратить страницы, изначально предназначенные для внешнего потребления, в стабильные, проверяемые и воспроизводимые входы. Страницы статей, страницы документации, базы знаний, справочные центры, открытые API и результаты общедоступного поиска будут затронуты в первую очередь и первыми увидят преимущества.

Этот уровень совместимости имеет четкие границы

Готовность агента не является универсальной целью.

Серверная часть всей интрасети, бизнес-система со строгим контролем разрешений, страница действий с коротким жизненным циклом и станция контента для публичного использования не находятся на одном уровне. Первый больше заботится о контроле, а второй больше заботится о читаемости, индексируемости и отслеживаемости. Принуждение этих двух типов систем к одному и тому же набору стандартов, которые «делают машины пригодными для использования», в конечном итоге только увеличит затраты на управление.

Но сложно продолжать делать вид, что на публичном сайте ничего не изменилось. Поисковые роботы с искусственным интеллектом будут все чаще читать страницы напрямую, а рабочие процессы агентов будут все больше полагаться на структурированный контент и стабильные действия. Если сайт по-прежнему придерживается идеи «людям достаточно его увидеть», рано или поздно появятся трещины в распределении контента, поиске, архивировании и автоматизированной интеграции.

Так что это изменение больше похоже на обновление совместимости. В прошлом интерфейсу приходилось учитывать разные браузеры, разные экраны и разные сети; теперь ему также приходится учитывать тип клиента, который может самостоятельно разбивать страницы, самостоятельно переходить по ссылкам и самостоятельно проверять статус. С добавлением этого уровня совместимости сайт действительно может ввести новое требование по умолчанию: он должен быть не только доступен для просмотра, но и стабильно использоваться.

FAQ

What to read next

Related

Continue reading

Frontend · 3 tags

В эпоху высокочастотных публикаций фронтенд-доставка требует перепроектирования совместной работы по кэшированию и сжатию.

Поскольку ресурсы становятся все более фрагментированными, а версии становятся все более частыми, зачастую в первую очередь выходит из-под контроля не степень сжатия, а ритм выпуска ключей кэша, версий словаря и затрат на возврат к исходному состоянию.

Frontend · 3 tags

Инструменты программирования искусственного интеллекта соперничают за доступ к рабочим процессам на уровне настольных компьютеров

После того, как внешний рабочий процесс берет на себя локальный агент, дифференциация продукта начинает переходить от параметров модели к управлению ссылками на выполнение.