Back home

Chiński model open source jest bardziej prawdopodobne, że zostanie spowolniony niż zablokowany.

To, co naprawdę staje się kruche, to dystrybucja, aktualizacje i łańcuchy zależności

Kiedy tego rodzaju dyskusja wpadnie w zakres projektu, ostatecznie sprowadzi się do chłodniejszego zdania: Trudno całkowicie wymazać model open source. To, co naprawdę staje się najpierw kruche, to linia montażowa obracająca się wokół modelu. Dopóki jeden z plików modelu, obrazów, wartości kontrolnych, środowiska wnioskowania i skryptów ewaluacyjnych jest uszkodzony, zespół będzie odczuwał nie to, „czy ten model nadal istnieje na świecie”, ale „czy to uaktualnienie da się odtworzyć”.

To, co naprawdę utknie, to zwykle wejścia i aktualizacje.

Oficjalną opiekę najłatwiej jest najpierw zamknąć. Strony internetowe, interfejsy API, strony pobierania, witryny lustrzane, o ile wejście jest scentralizowane, płatności, kwestie prawne, CDN, ograniczenia regionalne i zasady konta mogą to zawęzić. To samo dotyczy wnioskowania w chmurze. Gdy firma przekaże możliwości modelu do określonego punktu hostingowego, blokada nie musi usuwać modelu ze świata. Dopóki zaostrzone zostaną ograniczenia dostępności, kwot, płatności i regionalne, system zacznie się chwiać.

Ale gdy ciężar się rozproszy, sytuacja się zmienia. Model open source nie tylko znajduje się na określonej stronie głównej, ale także na dyskach lokalnych, tworzy pamięci podręczne, hurtownie obrazów i magazyn artefaktów zbudowany przez zespół. To, co możesz kontrolować, to raczej szybkość kontynuowania dystrybucji niż kopie, które już istnieją. Aby sytuacja była jasna, największy wpływ często nie ma „czy nadal można pobrać określoną wersję”, ale „czy można w przyszłości stabilnie uzyskać ten sam zestaw tokenizatorów, szablonów czatów, pakietów kwantyzacji i instrukcji zależności”.

Jest tu również najbardziej niedoceniany. Kiedy po raz pierwszy uruchamiasz model, wydaje się, że ryzyko minęło; prawdziwym problemem jest często drugi raz. Za drugim razem, gdy chciałem się cofnąć, obrazu już nie było; za drugim razem, gdy chciałem odtworzyć, zmienił się format kwantyfikacji; gdy chciałem dokonać aktualizacji po raz drugi, kod wnioskowania i wersja wagi nie pasowały; za drugim razem, gdy chciałem to sprawdzić, zestaw ewaluacyjny i skrypt przetwarzania wstępnego zostały zmienione. Na pozór brakuje tylko jednego łącza do pobrania, ale w rzeczywistości brakuje pełnego zestawu powtarzalnych łańcuchów dostaw.

Zatem ten rodzaj „pieczęci” bardziej przypomina spowolnienie niż usunięcie. To, co może znacznie osłabić, to szybkość komunikacji, dostęp do chmury, synchronizacja wersji i pewność ekologiczna; trudne do całkowitego wymazania są kopie ważone, możliwości wdrażania lokalnego i możliwości dystrybucji wtórnej, które się rozprzestrzeniły. Gdy model open source wejdzie na wystarczającą liczbę maszyn, ryzyko zmienia się z „czy może istnieć” na „czy może stabilnie ewoluować”.

Tutaj także krajowe drużyny najczęściej nie trafiają w punkt. Po zintegrowaniu modelu z produktem łatwo jest skupić się tylko na pierwszej rundzie efektów i zapomnieć, że model jest w rzeczywistości zależnością. Gdy zależność ma tylko jeden punkt wejścia, pojedynczy punkt stanie się punktem kontrolnym; gdy zależność nie ma blokady wersji, aktualizacje staną się zdarzeniem losowym; gdy zależność nie ma kopii offline, tak zwana „własna zdolność” zostanie ujawniona po awarii określonego serwera lustrzanego.

Bardziej stabilne podejście nie polega na wyobrażaniu sobie, że nie będzie żadnej blokady, ale na wcześniejszym podzieleniu blokady na kilka niedrogich małych problemów: waga i czas działania są przechowywane oddzielnie, adres pobierania i wartość weryfikacji są zapisywane razem, środowisko wnioskowania jest przebudowywane w trybie offline, wyniki oceny są archiwizowane według wersji, a ścieżka wycofania jest równie jasna jak ścieżka wydania. W ten sposób, nawet jeśli upstream nagle zostanie wyłączony, produkt straci tylko jedno wejście, a cała funkcja nie będzie jednocześnie offline.

Prawdziwą fosą modelu open source nigdy nie było to, że „nikt nie odważy się nim zarządzać”, ale „kiedy jest zarządzany, zarządzanie nim jest już do pewnego stopnia trudne”. Istnieje wiele wejść, które można uszczelnić, a odzyskanie kopii, które się rozprzestrzeniły, jest trudne.