Çin'in açık kaynak modelinin asıl atılımı işbirliği ağıdır
Ağırlık uygulanabilir ve güncellemeler, incelemeler ve fikir birliği daha kırılgan olacaktır.
Açık kaynak modelde “mühürlenip mühürlenmeyeceğinden” bahsederken bakılması en kolay şey ağırlık dosyasını her şey olarak kabul etmektir.
Ağırlıklar indirildikten sonra modelin kendisi çoğu zaman o kadar kolay kaybolmaz. İlk önce kırılması daha kolay olan, onun etrafında dönen ağdır: ayna siteleri, değerlendirme kümeleri, çıkarım şablonları, ince ayar komut dosyaları, sorun düzeltmeleri, varsayılan dağıtım parametreleri ve topluluktaki “bu sürüm çalıştırılabilir ve bu sürüme dokunulmamalıdır” şeklindeki fikir birliği.
Yere çarpabilecek kısım kırılmaktan en az korkan kısımdır.
Açık kaynaklı bir model yerel bir depoya, nesne deposuna veya intranet görüntüsüne girdiği sürece, dış dünya ne kadar sıkı olursa olsun, dosya genellikle orada olacaktır. Çevrimdışı kopyalar, dahili önbellekler ve geçmiş yapı ürünlerinin tümü, “hala kullanılıp kullanılamayacağı” sorusunu uzun süre geciktirecektir.
Bu aynı zamanda açık kaynak modeli ile saf bulut hizmetleri arasındaki en büyük farktır. Bir bulut hizmeti engellendiğinde giriş genellikle kaybolur; Açık kaynak modelin yukarı akış hizmeti durdurulsa bile eldeki ağırlıklar, tokenizer ve çıkarım görüntüsü çalışmaya devam edebilir. Soru “buna sahip misin?” değil. ama “diğerleriyle aynı şekilde kullanmaya devam edebilir misin?”
Gerçekten net olan şey senkronizasyon ilişkisidir
Modelin çalışmaya devam edebilmesi, ekibin buna ayak uydurabileceği anlamına gelmez.
Gevşetilmesi gereken ilk şeyler genellikle senkronizasyon ilişkileridir:
- Yukarı akış yeni bir sürüm yayınladı, ancak iç ayna zamana ayak uyduramadı.
- Değerlendirme seti revize edildi ve regresyon sonuçları artık eski kayıtlarla uyumlu hale getirilemiyor.
- Sohbet şablonu veya belirteç biraz taşındı, ancak çıktı stili çok değişti.
- Belirli bir düzeltme, kurumsal intranet görüntüsüne değil, yalnızca topluluk PR’ye girdi
- Varsayılan niceleme, varsayılan bağlam uzunluğu ve varsayılan örnekleme parametrelerinin her biri birbirinden ayrılmıştır.
Bunlar kendi başlarına büyük görünmüyor, ancak bunları bir araya getirmek “aynı modeli” birkaç parçaya ayıracaktır.
Bu aşamada dış kısıtlamaların asıl zararı, dünyadan ağırlıklı bir belgenin silinmesi değil, “herkesin aynı şeye baktığı” gerçeğinin kırılmasıdır. Ekip hâlâ aynı model adından bahsediyor ancak gerçekte elde ettikleri şey farklı sürümler, farklı şablonlar ve farklı parametrelerden oluşan bir kombinasyon paketi.
İncelemeler, düzeltmeler ve deneyimler bir arada sunulacak
Açık kaynaklı bir model gerçek iş akışına girdiğinde, gerçek değer genellikle ağırlığın kendisi değil, ağırlığın etrafında biriken yargıdır.
Hangi sürüm daha kararlı, hangi tokenizer uzun metni kıracak, hangi örnekleme parametreleri seti müşteri hizmetleri senaryoları için daha uygun, hangi ince ayarlı komut dosyası yanılsamayı artıracak, tüm bu deneyimler sürekli alışverişe dayanıyor. İşbirliği ağı devam ettiği sürece herkes hâlâ aynı temel çizgi üzerinde düzeltmeler yapabilir; İşbirliği ağı bozulduğunda her ekip yavaş yavaş kendi özel versiyonunu geliştirecektir.
Özel sürümler kötü bir şey değil, ancak fiyatı artıyor:
- Başlangıç noktasına dönüşün yeniden kullanılması giderek zorlaşıyor
- Kaza incelemesinin uyumlaştırılması giderek zorlaşıyor
- Düzeltme ekinin senkronize edilmesinin giderek zorlaşması düzeltildi
- Aynı sorun farklı takımlarda tekrar tekrar ortaya çıkacak
Şu anda “model hala orada” gibi görünüyor, ancak aslında “zar zor kullanılabilen birçok yerel kopya” haline geldi ve aralarında ortak bir güncelleme yolu yok.
Gerçekten endişelenmeye değer olan şey engellemek değil, çatallanmaktır
Açık kaynak modelinin çevrimiçi bir API gibi tamamen mühürlenmesi zordur çünkü tekrarlanabilirlik mevcuttur. Gerçekten dikkatli olmamız gereken şey, dış baskının dağıtım, onarım ve işbirliğini kesintiye uğratmasının ardından modelin farklı organizasyonların ritimleri doğrultusunda sapmaya başlamasıdır.
Daha fazla çatal olduğunda artık “indirilebilir mi?” sorusu ortadan kalkar. ama “Bunun hâlâ aynı türden bir şey olduğunu kim garanti edebilir?” Bu durum erişim maliyetini doğrudan artıracaktır: Yeni incelemelerin yeniden yapılması, eski hataların yeniden açıklanması, sürüm farklılıklarının yeniden düzenlenmesi ve ekibin her çatallanan hat için kendi geri alma ve dondurma stratejilerini oluşturması gerekecektir.
Açık kaynak modelinin dayanıklılığı gerçekten de saf bulut hizmetlerinden daha güçlüdür; ancak kırılganlığı da çok açık; ağırlığın ortadan kalkıp kalkmadığı değil, işbirliği ağının aynı adı aynı şeyle sürdürmeye devam edip edemeyeceği.
What to read next
Want more posts about AI?
Posts in the same category are usually the best next step for reading more on this topic.
View same categoryWant to keep following #AI?
Tags are useful for related tools, specific problems, and similar troubleshooting notes.
View same tagWant to explore another direction?
If you are not sure what to read next, return to the homepage and start from categories, topics, or latest updates.
Back home