Back home

Khả năng tương thích web dành cho Đại lý đang chuyển từ tính năng bổ sung sang yêu cầu mặc định

Các trang web công cộng phải có thể đọc được, xác minh và theo dõi được bởi con người, trình thu thập dữ liệu và tác nhân

Một phần nội dung bình thường xuất hiện trong trình duyệt nhưng thường không thể đọc được hoàn toàn khi được chuyển tới chương trình đại lý. Chỉ vì trang có thể được mở, không có nghĩa là trang đó thực sự có thể được sử dụng; chỉ vì con người có thể nhìn thấy nó không có nghĩa là nó có thể được máy móc đọc, xác minh và theo dõi một cách ổn định.

Vấn đề này từng được coi là một vấn đề phụ, như “điền vào sơ đồ trang web” hoặc “thêm một số dữ liệu có cấu trúc vào trang bài viết”. Nó không còn là một góc nữa. Khi một trang web công cộng phải đối mặt với trình thu thập thông tin AI, truy xuất tự động và quy trình làm việc dựa trên tác nhân, các đối tượng tương thích không còn chỉ là trình duyệt và công cụ tìm kiếm mà còn là một loại ứng dụng khách có thể chia trang dựa trên ngữ nghĩa, chuyển trang dựa trên liên kết và tiếp tục thực thi dựa trên trạng thái. Nếu một trang chỉ thân thiện với người đọc nhưng lại đầy rẫy những cạm bẫy đối với những khách hàng như vậy, nó sẽ bắt đầu trông giống như một trang web không có khả năng tương thích không đầy đủ.

Chỉ vì trang có thể mở được không có nghĩa là trang đó có thể đọc được.

Vấn đề đầu tiên thường không phải là chất lượng nội dung mà là cách đầu ra nội dung.

Nếu một trang nhúng nội dung văn bản vào hiển thị phía máy khách, ẩn các trường khóa trong bảng xếp hạng, chuyển phân trang thành luồng cuộn mà không có URL rõ ràng và hiển thị bảng thành hình ảnh, thì chương trình tác nhân chỉ có thể dựa vào phỏng đoán. Đối với con người, việc đoán sai có thể có nghĩa là bỏ sót một đoạn văn; đối với một cỗ máy, việc đoán sai có thể khiến các hành động tiếp theo đi chệch hướng và một vài bước nữa trong tương lai sẽ chỉ tiếp tục theo cách hiểu sai.

Loại vấn đề này đặc biệt rõ ràng trên các trang tài liệu và trang nội dung. Người đọc con người theo dõi lớp hình ảnh và tự hoàn thiện bối cảnh; đại lý thì không. Những gì tác nhân nhìn thấy là DOM, hệ thống phân cấp tiêu đề, mối quan hệ liên kết, điều khiển biểu mẫu, mã trạng thái và văn bản có thể thu thập thông tin. Nếu văn bản chính bị ngắt kết nối với các tín hiệu cơ bản này, trang sẽ xuất hiện ở trạng thái khó xử: trông hiện đại nhưng thực tế lại không ổn định.

Trước đây, khi di chuyển các ứng dụng một trang, lớp này thường là lớp đầu tiên được hiển thị. Màn hình đầu tiên xuất hiện, có thể tương tác nhưng máy chụp shell, văn bản thật không xuất hiện cho đến khi viết xong script. Cùng với việc lười tải, cuộn vô hạn và nhiều thiết kế “mở rộng và xem” khác nhau, trang nội dung sẽ trở thành một chuỗi các sự kiện ngẫu nhiên. Đối với người dùng trình duyệt, đó chỉ là sự chậm lại một chút; đối với các đại lý, đó là một chuỗi các mục không đáng tin cậy.

Cái máy muốn là lối vào ổn định chứ không phải nội dung trực quan.

Làm cho trang web “sẵn sàng cho tác nhân” về cơ bản là thêm một lớp tương thích, thay vì thêm một thủ thuật mới.

Khía cạnh có giá trị nhất của lớp tương thích này không phải là làm cho trang “trông giống như dành cho máy”, mà là nêu rõ những thông tin cơ bản nhất: đây là trang nào, văn bản ở đâu, trạng thái hiện tại là gì, liệu nó có thể tiếp tục nhảy hay không và những gì sẽ được trả về khi thất bại. Chừng nào những sự thật này còn chưa ổn định, các đặc vụ sẽ liên tục kiểm tra các ranh giới.

Những điều đáng giá nhất cần giải quyết đầu tiên trong các trang nội dung thường là những điều sau:

  • Văn bản phải có thể truy cập trực tiếp từ HTML mà không cần dựa vào các tập lệnh để đoán nó
  • Hệ thống phân cấp tiêu đề phải ổn định và không để phong cách trực quan thay thế cấu trúc ngữ nghĩa.
  • Phân trang, lọc và kết quả tìm kiếm phải có URL có thể chia sẻ, thay vì chỉ tồn tại ở trạng thái giao diện người dùng
  • Hình ảnh, bảng và khối mã phải có văn bản thay thế hoặc văn bản gốc có thể đọc được
  • Việc xuất cơ bản của trang chuẩn, sơ đồ trang web và nguồn cấp dữ liệu phải sạch sẽ và không bị trộn lẫn với một loạt các tham số tạm thời.

Những điều này nghe có vẻ sáo rỗng nhưng ý nghĩa của chúng giờ đây đã thay đổi. Trước đây, những thứ này được thêm vào vì mục đích của công cụ tìm kiếm và khả năng truy cập; giờ đây, những thông tin này được thêm vào để cho phép tác nhân định vị nội dung một cách ổn định, xác định mối quan hệ giữa các trang và tiến hành bước tiếp theo mà không cần lời nhắc thủ công. Tất cả đều hướng đến cùng một điều: trang cần được coi là đầu vào xác định của một khách hàng khác, thay vì là kết quả trực quan một lần.

Đây là lý do tại sao việc “thêm nút AI” không thực sự hữu ích. Bản thân nút này không làm cho trang dễ sử dụng hơn. Tốt nhất, nó chỉ gói một hành động vào một mục mới. Nếu lớp dưới cùng vẫn dựa vào bố cục trực quan và trạng thái tạm thời để duy trì sự hiểu biết, chương trình tổng đài viên sẽ vẫn mất khả năng kiểm soát khi làm mới, nhảy, quay lại và thay đổi quyền.

Tương tác phải hoàn thành hành động chứ không chỉ dừng lại ở dấu nhắc

Nếu trang chỉ để hiển thị nội dung thì vấn đề tương thích sẽ tương đối dễ giải quyết. Khi nói đến mức độ tương tác, vận hành thì vấn đề càng trở nên khó khăn hơn.

Điều mà một đại lý thực sự cần không phải là “gần như đủ” mà là ranh giới hành động rõ ràng. Gửi, xác nhận, thu hồi, tải xuống, đăng ký, chuyển và xuất, những hành động này tốt nhất phải có điều kiện tiên quyết rõ ràng, trả về lỗi và kết quả có thể theo dõi. Miễn là các hành động được trộn lẫn với một loạt cửa sổ bật lên, lời nhắc và xác nhận phụ, máy sẽ bị kẹt ở cùng một vị trí nhiều lần.

Đây là nơi mà sự khác biệt giữa các trang web công cộng và hệ thống nội bộ bắt đầu trở nên lớn hơn. Các trang web công cộng phải đối mặt với khả năng tiêu thụ, trong khi hệ thống nội bộ phải đối mặt với quyền và kiểm soát rủi ro. Cái trước phù hợp hơn để ổn định cấu trúc thông tin và ngữ nghĩa hành động, để khách hàng bên ngoài có thể tránh đi đường vòng; sau này không nên nới lỏng các ranh giới để “tương thích với Đại lý”, đặc biệt là khi có liên quan đến kinh phí, xuất bản, xóa và thay đổi quyền. Chúng ta vẫn phải bảo thủ ở những nơi chúng ta nên bảo thủ.

Vì vậy, đây không phải là việc chuyển đổi tất cả các trang web thành giao diện máy. Một cách tiếp cận thực tế hơn là biến các trang ban đầu được dự định để sử dụng bên ngoài thành các trang truy cập ổn định, có thể kiểm chứng và có thể chơi lại. Các trang bài viết, trang tài liệu, cơ sở kiến ​​thức, trung tâm trợ giúp, API mở và kết quả tìm kiếm công khai là những trang đầu tiên bị ảnh hưởng và là trang đầu tiên được hưởng lợi.

Mức độ tương thích này có ranh giới rõ ràng

Sẵn sàng cho đại lý không phải là mục tiêu chung cho tất cả.

Phần phụ trợ của một mạng nội bộ hoàn chỉnh, hệ thống kinh doanh có khả năng kiểm soát quyền mạnh mẽ, trang hoạt động có vòng đời ngắn và trạm nội dung dành cho công chúng không ở cùng một cấp độ. Cái trước quan tâm nhiều hơn đến khả năng kiểm soát, trong khi cái sau quan tâm nhiều hơn đến khả năng đọc, khả năng lập chỉ mục và khả năng truy xuất nguồn gốc. Việc buộc hai loại hệ thống này phải tuân theo cùng một bộ tiêu chuẩn để “làm cho máy móc có thể sử dụng được” cuối cùng sẽ chỉ làm tăng chi phí quản lý.

Nhưng thật khó để tiếp tục giả vờ rằng không có gì thay đổi trên trang web công cộng. Trình thu thập dữ liệu AI sẽ ngày càng đọc các trang trực tiếp và quy trình làm việc của nhân viên sẽ ngày càng dựa vào nội dung có cấu trúc và các hành động ổn định. Nếu một trang web vẫn bám vào quan điểm “người ta xem là đủ”, sớm hay muộn sẽ có những rạn nứt trong việc phân phối, truy xuất, lưu trữ nội dung và tích hợp tự động.

Vì vậy, thay đổi này giống một bản nâng cấp khả năng tương thích hơn. Trước đây, giao diện người dùng phải xem xét các trình duyệt khác nhau, màn hình khác nhau và mạng khác nhau; bây giờ nó cũng phải xem xét một loại máy khách có thể tự phân chia các trang, tự đi theo các liên kết và tự xác minh trạng thái. Với lớp tương thích này được thêm vào, trang web thực sự có thể đáp ứng một yêu cầu mặc định mới: nó không chỉ có thể xem được mà còn phải được sử dụng ổn định.

FAQ

What to read next

Related

Continue reading

Frontend · 3 tags

Phân phối giao diện người dùng trong kỷ nguyên xuất bản tần suất cao cần thiết kế lại bộ nhớ đệm và cộng tác nén

Khi các tài nguyên ngày càng bị phân mảnh và các phiên bản ngày càng xuất hiện thường xuyên hơn, điều đầu tiên thường không phải là tốc độ nén thực sự vượt khỏi tầm kiểm soát mà là nhịp độ giải phóng các khóa bộ đệm, phiên bản từ điển và chi phí quay về nguồn gốc.