Back home

เข้าร่วมการทดลองใช้ต้นทาง WebMCP

เขียนวัตถุประสงค์ของปุ่มและกล่องอินพุตถึงตัวแทน การรักษาความตั้งใจในระดับนี้เป็นต้นทุนระยะยาว

หลังจากที่ Chrome 149 เริ่มทดลองใช้งานต้นทางของ WebMCP ความสัมพันธ์ระหว่างหน้าเว็บและพร็อกซีจะมีความเกี่ยวข้องกันมากขึ้น หน้าเว็บไม่เพียงแค่วาง DOM และสำเนาที่มองเห็นได้เพื่อให้เครื่องคาดเดาอีกต่อไป ตัวควบคุมยังสามารถประกาศวัตถุประสงค์ สถานะ และขอบเขตการดำเนินการได้อีกด้วย การเปลี่ยนแปลงนี้ดูเหมือนเป็นการทดลองใช้ API แต่ในความเป็นจริงแล้ว มันเหมือนกับการยก “จุดประสงค์ของอินเทอร์เฟซ” จากข้อมูลโดยนัยไปเป็นโปรโตคอลที่ชัดเจนมากกว่า

คุณค่าของ WebMCP ไม่ใช่การเพิ่มชั้นคำศัพท์ให้กับหน้าเว็บ แต่เป็นการกระชับความไม่แน่นอนที่เจ้าหน้าที่กลัวมากที่สุด ไม่ว่าจะเป็นปุ่มสำหรับส่ง สลับ ยืนยัน หรือเพียงแค่เปิดเลเยอร์ป๊อปอัป ไม่ว่าช่องป้อนข้อมูลจะเป็นวันที่ คำค้นหา หรือเวลานัดหมายที่ต้องใช้รูปแบบพิเศษ ในอดีตข้อมูลนี้อนุมานจากข้อความ โครงสร้าง และบริบทเป็นหลัก การอนุมานได้ผล แต่เมื่อเพจมีความซับซ้อน เอเจนต์ก็เริ่มเข้าใจผิดว่า “ดูเหมือน” เป็น “เป็น”

สำหรับมนุษย์ การอ่านผิดนี้มักเป็นเพียงการคลิกผิด สำหรับตัวแทน การอ่านผิดกลายเป็นเส้นทางแห่งข้อผิดพลาดอย่างต่อเนื่อง มันจะดำเนินการต่อไปตามความเข้าใจที่ผิดจนกว่าจะพบกับการตรวจสอบ การย้อนกลับ หรือผลข้างเคียง ซึ่งเผยให้เห็นว่าขั้นตอนก่อนหน้านี้ได้ผิดพลาดไป หลังจากที่ WebMCP ทำให้ชั้นของอรรถศาสตร์นี้ชัดเจน เอเจนต์ก็ไม่จำเป็นต้องเดาว่าเพจนั้นเป็นแผนที่ที่มองเห็นได้เพียงอย่างเดียว และหน้าเว็บยังสามารถอธิบายความรับผิดชอบของพื้นผิวการโต้ตอบที่สำคัญได้อย่างชัดเจน

เรื่องนี้เหมาะที่สุดสำหรับอินเทอร์เฟซที่อธิบายได้ยากด้วยการเขียนคำโฆษณา HTML ล้วนๆ เช่น ปฏิทิน การจอง แอปพลิเคชันการอนุญาต แผงการตั้งค่า หรือกลุ่มหน้าที่ดูเหมือนกล่องป้อนข้อมูลธรรมดา แต่จริงๆ แล้วมีความหมายทางธุรกิจที่แตกต่างกัน เมื่ออาศัยเฉพาะป้ายกำกับและตัวยึดตำแหน่ง ตัวแทนมักจะต้องเลื่อนดูหน้าและลองซ้ำแล้วซ้ำอีก เมื่อเพจสามารถประกาศ “นี่คือการเลือกวันที่” “นี่คือการดำเนินการยืนยัน” และ “สถานะที่นี่สามารถเปลี่ยนไปในทิศทางนี้เท่านั้น” ค่าใช้จ่ายในการรวมระบบจะลดลงโดยตรง

แต่การทดลองดั้งเดิมยังทำให้เกิดปัญหาอีกประการหนึ่ง: จำเป็นต้องรักษาซีแมนทิกส์เลเยอร์นี้ไว้ โครงสร้างหน้าจะเปลี่ยนไป การคัดลอกปุ่มจะเปลี่ยนไป และสถานะธุรกิจจะเปลี่ยนไป หากชั้นของความตั้งใจที่เอเจนต์ต้องอาศัยจริงๆ ไม่ได้รับการอัพเดตร่วมกับส่วนประกอบต่างๆ ก็จะลอยไปในไม่ช้า ในเวลานั้นสภาวะที่อันตรายที่สุดไม่ใช่ “ใช้ไม่ได้โดยสิ้นเชิง” แต่ “ยังวิ่งได้ แต่บางครั้งก็ทำผิดพลาดและความผิดพลาดก็เป็นเรื่องปกติ”

ดังนั้น WebMCP จึงเป็นเหมือนสัญญากับหน้าเว็บมากกว่าที่จะเป็นการ์ดแจ้งเตือนที่โพสต์ไปยังตัวแทน กำหนดให้ส่วนหน้าเขียนขอบเขตการโต้ตอบในการนำไปใช้งาน การทดสอบ และการตรวจสอบการถดถอย ตราบใดที่สัญญาชั้นนี้ยังอยู่ในขั้นตอนการสาธิต เจ้าหน้าที่ทุกคนสามารถเข้าใจได้คือกรณีที่ประสบความสำเร็จ เมื่อเข้าสู่หน้าจริง สิ่งที่ต้องจัดการจริงๆ จะกลายเป็นความเข้ากันได้ของเวอร์ชัน เส้นทางดาวน์เกรด และวิธีแก้ปัญหาหลังจากการประกาศไม่ถูกต้อง

ฉันชอบที่จะถือว่าการทดลองต้นกำเนิดนี้เป็นสัญญาณบอกทิศทาง เบราว์เซอร์เริ่มพิจารณาอย่างจริงจังว่าตัวแทนอ่านหน้าเว็บอย่างไร ซึ่งหมายความว่าส่วนหน้าไม่เพียงแต่จัดรูปแบบสำหรับคนเท่านั้น แต่ยังกำหนดการดำเนินการสำหรับเครื่องด้วย ยิ่งเพจมีความซับซ้อนมากเท่าใด คำจำกัดความในชั้นนี้ก็มีคุณค่ามากขึ้นเท่านั้น ยิ่งเพจมีการเปลี่ยนแปลงบ่อยเท่าใด ค่าบำรุงรักษาของคำจำกัดความในชั้นนี้ก็จะยิ่งมีนัยสำคัญมากขึ้นเท่านั้น มรดกขั้นสุดท้ายของความสามารถ เช่น WebMCP จะไม่ใช่คำศัพท์ใหม่ แต่เป็นคำศัพท์สำหรับการจัดตำแหน่งอย่างต่อเนื่องระหว่างส่วนหน้าและเอเจนต์

FAQ

What to read next

Related

Continue reading

Frontend · 3 tags

การส่งมอบส่วนหน้าในยุคของการเผยแพร่ที่มีความถี่สูงจำเป็นต้องออกแบบการทำงานร่วมกันของแคชและการบีบอัดใหม่

เมื่อทรัพยากรกระจัดกระจายมากขึ้นเรื่อยๆ และเวอร์ชันต่างๆ บ่อยขึ้นเรื่อยๆ จึงมักจะไม่ใช่อัตราการบีบอัดที่ไม่สามารถควบคุมได้ก่อน แต่เป็นจังหวะการเปิดตัวของคีย์แคช เวอร์ชันพจนานุกรม และต้นทุนการคืนสู่จุดเริ่มต้น

Frontend · 3 tags

เครื่องมือการเขียนโปรแกรม AI กำลังแข่งขันกันเพื่อเข้าสู่เวิร์กโฟลว์ระดับเดสก์ท็อป

หลังจากที่เวิร์กโฟลว์ส่วนหน้าถูกควบคุมโดยตัวแทนภายในเครื่อง การสร้างความแตกต่างของผลิตภัณฑ์จะเริ่มโยกย้ายจากพารามิเตอร์โมเดลไปยังการควบคุมลิงก์การดำเนินการ