เข้าร่วมการทดลองใช้ต้นทาง WebMCP
เขียนวัตถุประสงค์ของปุ่มและกล่องอินพุตถึงตัวแทน การรักษาความตั้งใจในระดับนี้เป็นต้นทุนระยะยาว
หลังจากที่ Chrome 149 เริ่มทดลองใช้งานต้นทางของ WebMCP ความสัมพันธ์ระหว่างหน้าเว็บและพร็อกซีจะมีความเกี่ยวข้องกันมากขึ้น หน้าเว็บไม่เพียงแค่วาง DOM และสำเนาที่มองเห็นได้เพื่อให้เครื่องคาดเดาอีกต่อไป ตัวควบคุมยังสามารถประกาศวัตถุประสงค์ สถานะ และขอบเขตการดำเนินการได้อีกด้วย การเปลี่ยนแปลงนี้ดูเหมือนเป็นการทดลองใช้ API แต่ในความเป็นจริงแล้ว มันเหมือนกับการยก “จุดประสงค์ของอินเทอร์เฟซ” จากข้อมูลโดยนัยไปเป็นโปรโตคอลที่ชัดเจนมากกว่า
คุณค่าของ WebMCP ไม่ใช่การเพิ่มชั้นคำศัพท์ให้กับหน้าเว็บ แต่เป็นการกระชับความไม่แน่นอนที่เจ้าหน้าที่กลัวมากที่สุด ไม่ว่าจะเป็นปุ่มสำหรับส่ง สลับ ยืนยัน หรือเพียงแค่เปิดเลเยอร์ป๊อปอัป ไม่ว่าช่องป้อนข้อมูลจะเป็นวันที่ คำค้นหา หรือเวลานัดหมายที่ต้องใช้รูปแบบพิเศษ ในอดีตข้อมูลนี้อนุมานจากข้อความ โครงสร้าง และบริบทเป็นหลัก การอนุมานได้ผล แต่เมื่อเพจมีความซับซ้อน เอเจนต์ก็เริ่มเข้าใจผิดว่า “ดูเหมือน” เป็น “เป็น”
สำหรับมนุษย์ การอ่านผิดนี้มักเป็นเพียงการคลิกผิด สำหรับตัวแทน การอ่านผิดกลายเป็นเส้นทางแห่งข้อผิดพลาดอย่างต่อเนื่อง มันจะดำเนินการต่อไปตามความเข้าใจที่ผิดจนกว่าจะพบกับการตรวจสอบ การย้อนกลับ หรือผลข้างเคียง ซึ่งเผยให้เห็นว่าขั้นตอนก่อนหน้านี้ได้ผิดพลาดไป หลังจากที่ WebMCP ทำให้ชั้นของอรรถศาสตร์นี้ชัดเจน เอเจนต์ก็ไม่จำเป็นต้องเดาว่าเพจนั้นเป็นแผนที่ที่มองเห็นได้เพียงอย่างเดียว และหน้าเว็บยังสามารถอธิบายความรับผิดชอบของพื้นผิวการโต้ตอบที่สำคัญได้อย่างชัดเจน
เรื่องนี้เหมาะที่สุดสำหรับอินเทอร์เฟซที่อธิบายได้ยากด้วยการเขียนคำโฆษณา HTML ล้วนๆ เช่น ปฏิทิน การจอง แอปพลิเคชันการอนุญาต แผงการตั้งค่า หรือกลุ่มหน้าที่ดูเหมือนกล่องป้อนข้อมูลธรรมดา แต่จริงๆ แล้วมีความหมายทางธุรกิจที่แตกต่างกัน เมื่ออาศัยเฉพาะป้ายกำกับและตัวยึดตำแหน่ง ตัวแทนมักจะต้องเลื่อนดูหน้าและลองซ้ำแล้วซ้ำอีก เมื่อเพจสามารถประกาศ “นี่คือการเลือกวันที่” “นี่คือการดำเนินการยืนยัน” และ “สถานะที่นี่สามารถเปลี่ยนไปในทิศทางนี้เท่านั้น” ค่าใช้จ่ายในการรวมระบบจะลดลงโดยตรง
แต่การทดลองดั้งเดิมยังทำให้เกิดปัญหาอีกประการหนึ่ง: จำเป็นต้องรักษาซีแมนทิกส์เลเยอร์นี้ไว้ โครงสร้างหน้าจะเปลี่ยนไป การคัดลอกปุ่มจะเปลี่ยนไป และสถานะธุรกิจจะเปลี่ยนไป หากชั้นของความตั้งใจที่เอเจนต์ต้องอาศัยจริงๆ ไม่ได้รับการอัพเดตร่วมกับส่วนประกอบต่างๆ ก็จะลอยไปในไม่ช้า ในเวลานั้นสภาวะที่อันตรายที่สุดไม่ใช่ “ใช้ไม่ได้โดยสิ้นเชิง” แต่ “ยังวิ่งได้ แต่บางครั้งก็ทำผิดพลาดและความผิดพลาดก็เป็นเรื่องปกติ”
ดังนั้น WebMCP จึงเป็นเหมือนสัญญากับหน้าเว็บมากกว่าที่จะเป็นการ์ดแจ้งเตือนที่โพสต์ไปยังตัวแทน กำหนดให้ส่วนหน้าเขียนขอบเขตการโต้ตอบในการนำไปใช้งาน การทดสอบ และการตรวจสอบการถดถอย ตราบใดที่สัญญาชั้นนี้ยังอยู่ในขั้นตอนการสาธิต เจ้าหน้าที่ทุกคนสามารถเข้าใจได้คือกรณีที่ประสบความสำเร็จ เมื่อเข้าสู่หน้าจริง สิ่งที่ต้องจัดการจริงๆ จะกลายเป็นความเข้ากันได้ของเวอร์ชัน เส้นทางดาวน์เกรด และวิธีแก้ปัญหาหลังจากการประกาศไม่ถูกต้อง
ฉันชอบที่จะถือว่าการทดลองต้นกำเนิดนี้เป็นสัญญาณบอกทิศทาง เบราว์เซอร์เริ่มพิจารณาอย่างจริงจังว่าตัวแทนอ่านหน้าเว็บอย่างไร ซึ่งหมายความว่าส่วนหน้าไม่เพียงแต่จัดรูปแบบสำหรับคนเท่านั้น แต่ยังกำหนดการดำเนินการสำหรับเครื่องด้วย ยิ่งเพจมีความซับซ้อนมากเท่าใด คำจำกัดความในชั้นนี้ก็มีคุณค่ามากขึ้นเท่านั้น ยิ่งเพจมีการเปลี่ยนแปลงบ่อยเท่าใด ค่าบำรุงรักษาของคำจำกัดความในชั้นนี้ก็จะยิ่งมีนัยสำคัญมากขึ้นเท่านั้น มรดกขั้นสุดท้ายของความสามารถ เช่น WebMCP จะไม่ใช่คำศัพท์ใหม่ แต่เป็นคำศัพท์สำหรับการจัดตำแหน่งอย่างต่อเนื่องระหว่างส่วนหน้าและเอเจนต์
What to read next
Want more posts about Frontend?
Posts in the same category are usually the best next step for reading more on this topic.
View same categoryWant to keep following #AI?
Tags are useful for related tools, specific problems, and similar troubleshooting notes.
View same tagWant to explore another direction?
If you are not sure what to read next, return to the homepage and start from categories, topics, or latest updates.
Back home