返回首页

面向 Agent 的 Web 兼容性正在从附加功能变成默认要求

公开站点要同时对人、爬虫和代理程序保持可读、可验证和可追踪

浏览器里看着正常的一篇内容,丢给代理程序时却经常读不全。页面能打开,不代表页面真的能被消费;能被人看见,不代表能被机器稳定读取、验证和追踪。

这件事以前常被当成边角问题,像“顺手把 sitemap 补一下”或者“给文章页加点结构化数据”。现在已经不是边角了。公开站点一旦要面对 AI crawler、自动化检索、代理式工作流,兼容对象就不再只有浏览器和搜索引擎,还多了一类会按语义拆页面、按链接跳转、按状态继续执行的客户端。页面如果只对人类阅读友好,对这类客户端却处处是陷阱,就会开始显得像一个兼容性不完整的网站。

页面能打开,不等于页面能被读懂

最先出问题的通常不是内容质量,而是内容输出方式。

一个页面如果把正文塞进客户端渲染、把关键字段藏在折叠面板里、把分页做成无明确 URL 的滚动流、把表格渲染成图片,代理程序就只能靠猜。对人来说,猜错一次可能只是读漏一段;对机器来说,猜错一次就会把后续动作带偏,后面再多做几步也只是沿着错误理解继续走。

这类问题在文档站和内容站尤其明显。人类读者会顺着视觉层自己补全上下文,代理程序不会。代理程序看到的是 DOM、标题层级、链接关系、表单控件、状态码和可抓取文本。如果正文和这些基础信号脱节,页面就会出现一种很尴尬的状态:看起来很现代,实际上不稳定。

过去做单页应用迁移时,最早暴露的往往也是这一层。首屏出来了,交互也能点,但机器抓到的是壳,真正的正文要等脚本跑完才出现;再碰上懒加载、无限滚动和各种“展开后再看”的设计,内容页面就会变成一串偶发事件。对浏览器用户,这只是稍慢一点;对代理程序,这就是一连串不可靠的入口。

机器要的是稳定入口,不是视觉上像内容

把站点做成“agent-ready”,本质上是在补一层兼容性,而不是加一个新花样。

这层兼容性最值钱的地方,不是让页面“看起来像给机器用的”,而是把几个最基础的事实写清楚:这是什么页面、正文在哪里、当前状态是什么、能不能继续跳、失败时该返回什么。只要这些事实不稳定,代理程序就会在边界处反复试探。

内容站里最值得先处理的,通常是这些东西:

  • 正文必须能直接从 HTML 里拿到,不依赖脚本猜出来
  • 标题层级要稳定,别让视觉样式替代语义结构
  • 分页、筛选、搜索结果要有可分享的 URL,而不是只存在于前端状态
  • 图片、表格、代码块要有可读的替代文本或原始文本
  • canonical、sitemap、feed 这些基础出口要干净,别和一堆临时参数混在一起

这些听上去像老生常谈,但它们现在的意义变了。以前补这些,是为了搜索引擎和无障碍;现在补这些,还为了让代理程序在没有人工提示的情况下也能稳定定位内容、判断页面之间的关系、继续下一步动作。它们共同指向的是同一件事:页面要能被另一个客户端当成确定的输入,而不是一次性视觉结果。

这也是为什么“加一个 AI 按钮”没有什么本质帮助。按钮本身不会让页面更可消费,最多只是把某个动作包装成一个新入口。底层如果还是靠视觉布局和临时状态维持理解,代理程序照样会在刷新、跳转、回退、权限变化时失去抓手。

交互要落成动作,不能只停在提示

如果页面只是内容展示,兼容性问题还算好收。真到交互和操作层,问题会更硬。

代理程序真正需要的不是“差不多能点”,而是清楚的动作边界。提交、确认、撤销、下载、订阅、跳转、导出,这些动作最好都有明确的前置条件、失败返回和可追踪结果。只要动作还是混在一堆弹窗、提示语和二次确认里,机器就会在同样的地方反复卡住。

这也是公开站点和内部系统的区别开始变大的地方。公开站点面对的是可消费性,内部系统面对的是权限和风控。前者更适合把信息结构和动作语义做稳,让外部客户端少走弯路;后者不该为了“兼容 Agent”去放松边界,尤其是涉及资金、发布、删除和权限变更的地方。该保守的地方还是得保守。

所以这不是把所有网页都改造成机器接口。更现实的做法,是把本来就面向外部消费的那部分页面,先变成稳定、可验证、可回放的入口。文章页、文档页、知识库、帮助中心、开放 API、公开搜索结果,这些地方最先受影响,也最先能看见收益。

这层兼容性有明确边界

agent-ready 不是一个适合所有系统的统一目标。

完全内网的后台、强权限控制的业务系统、短生命周期的活动页,和面向公开消费的内容站,不在同一个层级上。前者更在乎控制,后者更在乎可读、可索引、可追踪。把这两类系统硬塞进同一套“让机器都能用”的标准,最后只会把治理成本抬高。

但公开站点这边已经很难继续装作没变化了。AI crawler 会越来越多地直接读页面,代理工作流也会越来越依赖结构化内容和稳定动作。站点如果还停留在“能给人看就够了”的思路上,迟早会在内容分发、检索、归档、自动化集成这些环节里露出缝。

所以这次变化更像一次兼容性升级。以前前端要考虑不同浏览器、不同屏幕、不同网络;现在还得考虑一类会自己拆页面、自己沿着链接走、自己验证状态的客户端。把这层兼容性补上,站点才算真正进入了一个新的默认要求:不只是能看,还得能被稳定消费。

下一步

读完之后,下一步看什么

相关阅读

继续阅读