Back home

La compatibilidad web para agentes pasará de ser una función complementaria a ser un requisito predeterminado

Los sitios públicos deben ser legibles, verificables y rastreables por humanos, rastreadores y agentes.

Un fragmento de contenido normal aparece en el navegador, pero a menudo no se puede leer por completo cuando se pasa al programa agente. El hecho de que la página se pueda abrir no significa que realmente se pueda consumir; El hecho de que pueda ser visto por personas no significa que las máquinas puedan leerlo, verificarlo y rastrearlo de manera estable.

Este asunto solía considerarse como un tema secundario, como “completar el mapa del sitio” o “agregar algunos datos estructurados a la página del artículo”. Ya no es un rincón. Una vez que un sitio público se enfrenta a rastreadores de IA, recuperación automatizada y flujos de trabajo basados ​​en agentes, los objetos compatibles ya no son solo navegadores y motores de búsqueda, sino también un tipo de cliente que puede dividir páginas según la semántica, saltar según los enlaces y continuar la ejecución según el estado. Si una página sólo es amigable para lectores humanos pero está llena de trampas para dichos clientes, comenzará a parecer un sitio web con compatibilidad incompleta.

El hecho de que la página se pueda abrir no significa que se pueda leer.

El primer problema no suele ser la calidad del contenido, sino la forma en que se publica.

Si una página incorpora texto del cuerpo en la representación del lado del cliente, oculta campos clave en paneles de acordeón, convierte la paginación en un flujo de desplazamiento sin URL explícitas y presenta tablas en imágenes, el programa agente sólo puede confiar en conjeturas. Para los humanos, una suposición equivocada puede significar que se omite un párrafo; para una máquina, una suposición equivocada puede hacer que las acciones posteriores se extravíen, y unos cuantos pasos más en el futuro simplemente continuarán con una comprensión equivocada.

Este tipo de problema es especialmente obvio en sitios de documentos y sitios de contenido. Los lectores humanos siguen la capa visual y completan el contexto ellos mismos; los agentes no. Lo que ve el agente es el DOM, la jerarquía de encabezados, las relaciones de enlaces, los controles de formulario, los códigos de estado y el texto rastreable. Si el texto principal está desconectado de estas señales básicas, la página aparecerá en un estado incómodo: parece moderna pero en realidad es inestable.

Al migrar aplicaciones de una sola página en el pasado, esta capa solía ser la primera en quedar expuesta. Aparece la primera pantalla y la interacción es posible, pero la máquina captura el shell y el texto real no aparece hasta que se termina el script. Junto con la carga diferida, el desplazamiento infinito y varios diseños de “expandir y ver”, la página de contenido se convertirá en una serie de eventos accidentales. Para los usuarios de navegadores, es sólo una ligera desaceleración; para los agentes, es una cadena de entradas poco confiables.

Lo que la máquina quiere es una entrada estable, no contenido visual.

Hacer que el sitio esté “listo para los agentes” es esencialmente agregar una capa de compatibilidad, en lugar de agregar un nuevo truco.

El aspecto más valioso de esta capa de compatibilidad no es hacer que la página “parezca para máquinas”, sino indicar claramente los hechos más básicos: qué página es, dónde está el texto, cuál es el estado actual, si puede continuar saltando y qué se debe devolver cuando falla. Mientras estos hechos sean inestables, los agentes pondrán a prueba los límites repetidamente.

Las cosas más valiosas de las que hay que ocuparse primero en los sitios de contenido suelen ser estas:

  • El texto debe ser accesible directamente desde el HTML, sin depender de scripts para adivinarlo.
  • La jerarquía de títulos debe ser estable y no permitir que el estilo visual reemplace la estructura semántica.
  • La paginación, el filtrado y los resultados de búsqueda deben tener URL que se puedan compartir, en lugar de existir solo en el estado frontal.
  • Las imágenes, tablas y bloques de código deben tener texto alternativo legible o texto original.
  • Las exportaciones básicas de canonical, sitemap y feed deben estar limpias y no mezcladas con un montón de parámetros temporales.

Puede que parezcan clichés, pero ahora su significado ha cambiado. En el pasado, se añadían por motivos de accesibilidad y motores de búsqueda; ahora, estos se agregan para permitir que el agente ubique contenido de manera estable, determine la relación entre páginas y continúe con el siguiente paso sin indicaciones manuales. Todos apuntan a lo mismo: la página debe ser tratada como una entrada definitiva de otro cliente, en lugar de un resultado visual único.

Es por eso que “agregar un botón de IA” realmente no ayuda. El botón en sí no hace que la página sea más consumible. En el mejor de los casos, simplemente incluye una acción en una nueva entrada. Si la capa inferior aún depende del diseño visual y el estado temporal para mantener la comprensión, el programa agente aún perderá su control al actualizar, saltar, retroceder y cambiar permisos.

La interacción debe completar la acción, no solo detenerse en el mensaje

Si la página es sólo para mostrar contenido, los problemas de compatibilidad son relativamente fáciles de solucionar. Cuando se trata del nivel de interacción y operación, el problema se vuelve aún más difícil.

Lo que un agente realmente necesita no es “casi suficiente”, sino límites de acción claros. Enviar, confirmar, revocar, descargar, suscribirse, saltar y exportar; estas acciones preferiblemente deben tener condiciones previas claras, devoluciones de fallas y resultados rastreables. Mientras las acciones se combinen con un montón de ventanas emergentes, mensajes y confirmaciones secundarias, la máquina se quedará atascada en el mismo lugar una y otra vez.

Aquí es donde la diferencia entre sitios públicos y sistemas internos comienza a hacerse grande. Los sitios públicos enfrentan la consumibilidad, mientras que los sistemas internos enfrentan permisos y control de riesgos. El primero es más adecuado para estabilizar la estructura de la información y la semántica de la acción, de modo que los clientes externos puedan evitar desvíos; estos últimos no deberían flexibilizar los límites para ser “compatibles con los Agentes”, especialmente cuando se trata de cambios de fondos, publicación, eliminación y permisos. Todavía tenemos que ser conservadores donde deberíamos ser conservadores.

Así que no se trata de transformar todas las páginas web en interfaces de máquinas. Un enfoque más realista es convertir las páginas que originalmente estaban destinadas al consumo externo en entradas estables, verificables y reproducibles. Las páginas de artículos, las páginas de documentación, las bases de conocimientos, los centros de ayuda, las API abiertas y los resultados de búsqueda públicos son los primeros en verse afectados y los primeros en ver los beneficios.

Este nivel de compatibilidad tiene límites claros

La preparación del agente no es un objetivo único para todos.

El backend de una intranet completa, el sistema empresarial con un fuerte control de permisos, la página de actividad de ciclo de vida corto y la estación de contenido para consumo público no están al mismo nivel. El primero se preocupa más por el control, mientras que el segundo se preocupa más por la legibilidad, la indexabilidad y la trazabilidad. Forzar a estos dos tipos de sistemas a seguir el mismo conjunto de estándares que “hacen que las máquinas sean utilizables” sólo aumentará los costos de gestión al final.

Pero es difícil seguir fingiendo que nada ha cambiado en el sitio público. Los rastreadores de IA leerán cada vez más páginas directamente y los flujos de trabajo de los agentes dependerán cada vez más de contenido estructurado y acciones estables. Si un sitio todavía se apega a la idea de “es suficiente que la gente lo vea”, tarde o temprano habrá grietas en la distribución, recuperación, archivo e integración automatizada de contenido.

Entonces este cambio se parece más a una actualización de compatibilidad. En el pasado, el front-end tenía que considerar diferentes navegadores, diferentes pantallas y diferentes redes; ahora también tiene que considerar un tipo de cliente que pueda dividir páginas por sí mismo, seguir enlaces por sí mismo y verificar el estado por sí mismo. Con esta capa de compatibilidad agregada, el sitio realmente puede ingresar un nuevo requisito predeterminado: no sólo debe ser visible, sino también consumirse de manera estable.

FAQ

What to read next

Related

Continue reading