Back home

Model open source Tiongkok kemungkinan besar akan diperlambat daripada diblokir.

Yang menjadi rapuh adalah distribusi, pembaruan, dan rantai ketergantungan

Ketika diskusi semacam ini dimasukkan ke dalam proyek, pada akhirnya akan menyatu menjadi kalimat yang lebih dingin: Sulit untuk sepenuhnya menghapus model open source. Yang pertama menjadi rapuh adalah jalur perakitan yang berputar di sekitar model. Selama salah satu file model, gambar, nilai pemeriksaan, lingkungan inferensi, dan skrip evaluasi rusak, yang akan dirasakan tim bukanlah “apakah model ini masih ada di dunia”, tetapi “apakah peningkatan ini dapat direproduksi.”

Yang paling stuck biasanya adalah entry dan update.

Penahanan resmi adalah cara termudah untuk ditutup terlebih dahulu. Halaman web, API, halaman unduh, situs cermin, selama pintu masuknya terpusat, pembayaran, urusan hukum, CDN, batasan regional, dan kebijakan akun semuanya dapat mempersempitnya. Hal yang sama berlaku untuk inferensi cloud. Setelah kemampuan model outsourcing bisnis ke titik hosting tertentu, blokade tidak perlu menghapus model tersebut dari dunia. Selama aksesibilitas, kuota, pembayaran, dan pembatasan regional diperketat, sistem akan mulai terguncang.

Namun begitu bebannya hilang, situasinya berubah. Model sumber terbuka tidak hanya ada di beranda tertentu, tetapi juga ada di disk lokal, cache build, gudang gambar, dan penyimpanan artefak yang dibangun oleh tim. Yang dapat Anda kendalikan adalah kecepatan kelanjutan distribusi dibandingkan salinan yang sudah ada. Untuk memperjelas situasi ini, dampak terbesar sering kali bukan pada “apakah Anda masih dapat mengunduh versi tertentu”, tetapi “apakah Anda bisa mendapatkan kumpulan tokenizer, templat obrolan, paket kuantisasi, dan instruksi ketergantungan yang sama secara stabil di masa mendatang.”

Ini juga yang paling diremehkan di sini. Saat pertama kali Anda menjalankan model tersebut, risikonya tampaknya sudah berakhir; masalah sebenarnya sering kali terjadi untuk kedua kalinya. Kali kedua saya ingin memutar kembali, gambarnya sudah tidak ada lagi; kedua kalinya saya ingin mereproduksi, format kuantifikasi telah berubah; kedua kalinya saya ingin memutakhirkan, kode inferensi dan versi bobot tidak cocok; kedua kalinya saya ingin memverifikasi, set evaluasi dan skrip prapemrosesan telah diubah. Di permukaan, hanya ada satu tautan unduhan yang hilang, namun kenyataannya, yang hilang adalah satu set lengkap rantai pasokan yang dapat diulang.

Jadi jenis “segel” ini lebih seperti perlambatan daripada penghapusan. Yang dapat dilemahkan secara signifikan adalah kecepatan komunikasi, akses cloud, sinkronisasi versi, dan kepercayaan ekologis; yang sulit untuk dihapus sepenuhnya adalah salinan tertimbang, kemampuan penerapan lokal, dan kemampuan distribusi sekunder yang telah menyebar. Setelah model open source memasuki cukup banyak mesin, risikonya berubah dari “dapatkah model tersebut ada” menjadi “dapatkah model tersebut berkembang secara stabil”.

Di sinilah kemungkinan besar tim-tim domestik akan meleset dari sasaran. Setelah mengintegrasikan model ke dalam produk, mudah untuk hanya fokus pada efek putaran pertama dan melupakan bahwa model tersebut sebenarnya adalah ketergantungan. Ketika ketergantungan hanya memiliki satu titik masuk, titik tunggal tersebut akan menjadi titik kontrol; ketika ketergantungan tidak memiliki penguncian versi, pemutakhiran akan menjadi peristiwa acak; jika suatu ketergantungan tidak memiliki salinan offline, apa yang disebut “kemampuan sendiri” akan terungkap setelah mirror tertentu gagal.

Pendekatan yang lebih stabil adalah dengan tidak membayangkan bahwa tidak akan ada blokade, tetapi memecah blokade menjadi beberapa masalah kecil yang terjangkau terlebih dahulu: bobot dan waktu proses disimpan secara terpisah, alamat unduhan dan nilai verifikasi disimpan bersama, lingkungan inferensi dibuat untuk dibangun kembali secara offline, hasil evaluasi diarsipkan berdasarkan versi, dan jalur rollback sama jelasnya dengan jalur rilis. Dengan cara ini, meskipun upstream tiba-tiba dimatikan, produk hanya akan kehilangan satu pintu masuk, dan seluruh kemampuan tidak akan offline pada saat yang bersamaan.

Parit sebenarnya dari model open source bukanlah “tidak ada yang berani mengelolanya”, tetapi “ketika dikelola, sudah sulit untuk mengelolanya sampai pada titik tertentu.” Ada banyak pintu masuk yang bisa diperketat, dan sulit memulihkan salinan yang sudah tersebar.