Back home

Bước đột phá thực sự của mô hình nguồn mở của Trung Quốc là mạng lưới cộng tác

Sức nặng có thể được thực hiện và các cập nhật, đánh giá và đồng thuận sẽ mong manh hơn.

Khi nói về “liệu nó có được niêm phong hay không” trong mô hình nguồn mở, điều dễ nhìn thấy nhất là coi tệp trọng lượng là tất cả mọi thứ.

Sau khi tải trọng số xuống, bản thân mô hình thường không biến mất dễ dàng như vậy. Điều dễ bị phá vỡ đầu tiên là mạng xoay quanh nó: các trang nhân bản, bộ đánh giá, mẫu suy luận, tập lệnh tinh chỉnh, sửa lỗi, tham số triển khai mặc định và sự đồng thuận trong cộng đồng rằng “phiên bản này có thể chạy và không nên chạm vào phiên bản đó”.

Bộ phận có thể chạm đất là ít sợ gãy nhất.

Chỉ cần mô hình nguồn mở đã đi vào kho cục bộ, kho lưu trữ đối tượng hoặc hình ảnh mạng nội bộ thì cho dù thế giới bên ngoài có thắt chặt đến đâu thì tệp thường vẫn ở đó. Các bản sao ngoại tuyến, bộ đệm nội bộ và các sản phẩm xây dựng lịch sử đều sẽ trì hoãn câu hỏi “liệu nó còn có thể sử dụng được” trong một thời gian dài hay không.

Đây cũng là điểm khác biệt lớn nhất giữa mô hình nguồn mở và dịch vụ đám mây thuần túy. Khi dịch vụ đám mây bị chặn, lối vào thường không còn nữa; ngay cả khi dịch vụ ngược dòng của mô hình nguồn mở bị dừng, trọng số, mã thông báo và hình ảnh suy luận trong tay vẫn có thể tiếp tục chạy. Câu hỏi không phải là “bạn có nó không?” nhưng “bạn có thể tiếp tục sử dụng nó theo cách như những người khác không?”

Điều thực sự rõ ràng là mối quan hệ đồng bộ hóa

Chỉ vì mô hình có thể tiếp tục chạy không có nghĩa là nhóm có thể tiếp tục theo kịp nó.

Điều đầu tiên cần nới lỏng thường là các mối quan hệ đồng bộ hóa:

  • Thượng nguồn ra phiên bản mới nhưng gương trong không kịp.
  • Bộ đánh giá đã được sửa lại, kết quả hồi quy không còn phù hợp với các bản ghi cũ.
  • Mẫu trò chuyện hoặc mã thông báo đã được di chuyển một chút, nhưng kiểu đầu ra đã thay đổi rất nhiều.
  • Fix lỗi nào đó chỉ vào PR cộng đồng chứ không vào hình ảnh mạng nội bộ công ty
  • Mỗi tham số lượng tử hóa mặc định, độ dài ngữ cảnh mặc định và lấy mẫu mặc định được tách rời nhau.

Những thứ này bản thân chúng trông không lớn nhưng việc xếp chúng lại với nhau sẽ chia “cùng một mô hình” thành nhiều phần.

Ở giai đoạn này, tác hại thực sự do các hạn chế bên ngoài gây ra không phải là xóa một tài liệu có trọng lượng khỏi thế giới mà là phá vỡ sự thật rằng “mọi người đều đang nhìn vào cùng một thứ”. Nhóm vẫn đang nói về cùng một tên mẫu, nhưng những gì họ thực sự nhận được là một gói kết hợp với các phiên bản khác nhau, các mẫu khác nhau và các thông số khác nhau.

Đánh giá, sửa lỗi và trải nghiệm sẽ được chia nhỏ cùng nhau

Khi một mô hình nguồn mở đi vào quy trình làm việc thực, giá trị thực thường không phải là trọng số mà là phán đoán được tích lũy xung quanh trọng số.

Phiên bản nào ổn định hơn, mã thông báo nào sẽ phá vỡ văn bản dài, bộ tham số lấy mẫu nào phù hợp hơn với các kịch bản dịch vụ khách hàng, tập lệnh tinh chỉnh nào sẽ tăng ảo giác, những trải nghiệm này đều dựa vào trao đổi liên tục. Miễn là mạng cộng tác vẫn còn, mọi người vẫn có thể tìm hiểu về cùng một đường cơ sở; một khi mạng cộng tác bị hỏng, mỗi nhóm sẽ dần dần phát triển phiên bản riêng của mình.

Phiên bản riêng tư không phải là điều xấu nhưng giá lại tăng cao:

  • Trở về đường cơ sở ngày càng khó sử dụng lại
  • Việc xem xét tai nạn ngày càng khó điều chỉnh
  • Sửa lỗi bản vá ngày càng khó đồng bộ hóa
  • Vấn đề tương tự sẽ xuất hiện nhiều lần ở các đội khác nhau

Lúc này, nhìn thì có vẻ “mô hình vẫn còn đó”, nhưng thực tế nó đã trở thành “nhiều bản cục bộ gần như không sử dụng được” và không có đường dẫn cập nhật chung giữa chúng.

Điều thực sự đáng lo ngại không phải là chặn mà là fork

Mô hình nguồn mở khó có thể được niêm phong hoàn toàn như API trực tuyến vì có khả năng nhân rộng. Điều chúng ta thực sự nên cảnh giác là sau khi áp lực bên ngoài phá vỡ sự phân phối, sửa chữa và hợp tác, mô hình bắt đầu phân kỳ theo nhịp điệu của các tổ chức khác nhau.

Một khi có nhiều fork hơn, vấn đề không còn là “tải xuống được không?” nhưng “ai có thể đảm bảo rằng đây vẫn là loại sự việc tương tự?” Vấn đề này sẽ trực tiếp làm tăng chi phí truy cập: các đánh giá mới cần phải được thực hiện lại, các lỗi cũ cần được giải thích lại, các khác biệt về phiên bản cần được sắp xếp lại và nhóm phải đưa ra các chiến lược khôi phục và đóng băng của riêng mình cho từng dòng phân nhánh.

Khả năng phục hồi của mô hình nguồn mở thực sự mạnh hơn so với các dịch vụ đám mây thuần túy; nhưng lỗ hổng của nó cũng rất rõ ràng, không phải sức nặng đã bị lấy đi hay chưa, mà là liệu mạng lưới cộng tác có thể tiếp tục duy trì cùng một tên hay không.