Back home

Açık kaynak modelinin riskleri öncelikle erişim katmanına düşüyor

Modelin adı değişecek ama asıl stabil olması gereken şey ağırlık, yönlendirme ve geri dönüş.

Geçtiğimiz günlerde açık kaynak modellerin ABD’nin sıkılaştırma politikalarına takılıp kalmayacağı tartışılıyor. Mühendislikte değişen ilk şey model yetenekleri değil, varsayılan erişilebilirliktir. Model hâlâ orada, belgeler de öyle. Gerçekten ilk titreyen şey çekme adresi, ayna kaynağı, barındırma platformu, lisans koşulları ve bölgesel kullanılabilirliktir. İşe erişim sağlayan kişilerin sıklıkla karşılaştığı ilk şey, “modelin yeterince güçlü olmaması” değil, “bugün hala istikrarlı bir şekilde onu alabilir miyiz?”

Önce varsayılan erişilebilirlik kötüleşir

Geçmişte model erişimi yaparken karşılaşılan en can sıkıcı sorun “aynı model dün indirilebiliyordu ama bugün birdenbire 403 aldı.” Bu tür bir değişiklik, tedarik zincirinde küçük bir dalgalanma gibi görünse de aslında tüm bağlantıyı kararsız bir duruma sürükler: ağırlık indirmenin yeniden denenmesi gerekir, görüntü kaynağının değiştirilmesi gerekir, sağlama toplamının yeniden hesaplanması gerekir, dağıtım görüntüsünün yeniden paketlenmesi gerekir ve CI’daki önbellek de geçersiz hale gelir. Görünüşte sadece modeli elde etme aşaması kırılgan hale getirilmiş, ancak gerçekte “kullanılabilirlik” öncülü sistemden uzaklaştırılmıştır.

Açık kaynak modeli genellikle “kod açık kaynak olduktan sonra artık başkaları tarafından kontrol edilmeyeceği” şeklinde anlaşılır. Bu cümle sadece yarısı doğrudur. Açık kaynak kodu, varsayılan olarak erişilebilir olduğu anlamına gelmez ve depoda görünür olması, üretim ortamının istikrarlı bir şekilde başlatılabileceği anlamına gelmez. Kimin barındırdığı, hangi bölgede bulunduğu, lisansının değişip değişmediği ve indirme sıklığında herhangi bir kısıtlama olup olmadığı. Bu ayrıntılar platform, politikalar veya iş koşulları tarafından engellendiğinde, ekibin gördüğü şey “modelin ortadan kalkması” değil, “kolayca elde edilebilen şeylerin bakımı gereken bir altyapıya dönüşmesidir.”

Model arayüzü sistem sınırına kadar genişletilecek

Geçmişte model yönlendirmede tüm detayları yazdığımda toplanması en zor şey puanın iki veya üç puan farklı olması değil, model arayüzünün yeterince stabil olmamasıydı. Bir temel değiştirildiğinde, istem alışkanlıkları, çıktı yapısı, araç çağırma formatı ve uzun bağlam davranışının tümü buna göre değişecektir. Model adı değişmemiş gibi görünüyor ancak sistemdeki ayrıştırıcı, değerlendirme seti, tekrarlama günlüğü ve arıza yönetiminin yeniden çalıştırılması gerekiyor. O anda en kolay açığa çıkan şey, sistemin “belirli bir modeli” “belirli bir yetenek” olarak algılamasıydı.

Açık kaynak modelleriyle ilgili tartışmalarda da en çok gözden kaçırılan alandır bu. Gerçekten değerli olan, adın kendisi değil, sağlayabileceği değiştirilebilir yetenekler kümesidir: tamamlama, sınıflandırma, çıkarma, diyalog, araç çağırma, uzun makale özeti ve kod oluşturma. Erişim katmanı bu yetenekleri belirli modellere bağladığı sürece sonraki değişiklikler geçiş maliyetlerine yansıyacaktır. Öte yandan, eğer arayüz katmanı ilk önce istikrarlı bir sözleşmeye yoğunlaştırılırsa, taban bir bağımlılık gibi değiştirilebilir ve risk yalnızca sınırlı bir ölçüde sınırlı olacaktır.

Yönlendirme ve geri dönüş isimlerden daha önemlidir

Açık kaynak modelin “mühürlü” olup olmayacağı, nihai sistem üzerindeki etkisi genellikle modelin adı değil, bir çıkış yolu olup olmadığıdır. Bir ekip tüm görevleri tek bir uzak modele koyarsa, herhangi bir coğrafi kısıtlama, erişim kısıtlaması veya iş stratejisindeki değişiklikler doğrudan iş kesintisine neden olacaktır. Aksine, yerel olarak çalıştırılabilir modeller, yedek barındırma kaynakları, farklı yetenek seviyelerindeki model havuzları ve tekrar oynatılabilir değerlendirme kümelerinin tümü mevcut olduğu sürece, dış sınırlamalar en iyi ihtimalle değiştirme maliyetlerini artıracak ve sistemi hemen kullanılamaz hale getirmeyecektir.

Bu nedenle, model düzeyinde değerlendirmelerde bulunurken sadece “hangi model daha güçlü” diye sormak değil, aynı zamanda “bu yetenek zincirinin bir temel ile değiştirilebilir mi?” sorusunu da sormak en iyisidir. Ağırlıklar kontrol edilebilir bir depoda tutulabilir mi? Bağımlılıklar sabit sürümlere kilitlenebilir mi? Yönlendirme, önbelleğe alma, oynatma ve geri alma işlemlerinin tamamı bir dizi eyleme dönüştürülebilir mi? Bu sorular gerçek sınıra model adından daha yakındır. Modelin kısıtlanma riski ilk önce ortadan kalkmayacak ancak ilk önce varsayılan ulaşılabilirlik değişecek; ve sistemin sürdürmesi gereken şey asla bir model değil, sürekli olarak sağlanabilecek bir dizi yetenektir.