Back home

Po upublicznieniu modelu open source najbardziej delikatna jest trasa domyślna

To, że model nadal można pobrać, nie oznacza, że ​​domyślne wejście będzie zawsze dostępne.

Postaw pytanie w stylu: „Czy Stany Zjednoczone mogą zostać zapieczętowane?” a odpowiedź jest zwykle mniej dramatyczna. Pliki wag niekoniecznie znikną ze świata, ale domyślne trasy można łatwo zastąpić. Dopóki adres centrum, domyślna wartość zestawu SDK i wejście do wnioskowania online będą używane jako oczywistość, późniejsza automatyzacja będzie krucha.

Zacznij od adresu

Model open source zaczął się od adresu. Pociągnij, oceń, rozmieść, zwróć – wszystkie działania prowadzą do tego samego wejścia. Kiedy w górę rzeki się nie zmieniał, ścieżka ta wydawała się „gładka”, a nawet naturalna; kiedy zmienił się upstream, zdałem sobie sprawę, że nie polegałem na możliwościach modelu, ale na domyślnej ścieżce.

Najczęstszym punktem przerwania w projekcie nie jest stwierdzenie „w ogóle nie można uzyskać modelu”, ale „nadal można go uzyskać, ale nie oryginalnego”. Synchronizacja lustrzana jest powolna, aliasy są przełączane, dostęp regionalny jest ograniczony, wersja domyślna zostaje przeniesiona, ale skrypt nadal działa pod starym adresem. Ontologia modelu nadal istnieje, ale proces zaczął się zmieniać.

Awarie pojawiają się najpierw w automatyce

Ręczne przełączanie obrazów nie jest trudne, ale trudność polega na tym, że automatyzacja sama tego nie rozumie. CI, zaplanowana ocena, konstrukcja kontenera, zapisy eksperymentów, przykłady dokumentów i lokalne skrypty współpracowników mogą kopiować tę samą wartość domyślną. Dopóki nic się nie zmieni, stare wejście będzie nadal pojawiać się.

Również w tym miejscu określenie „pieczęć” jest najbardziej mylące. Prawdziwą zmianą często nie jest usunięcie wag, ale ponowne zapisanie wartości domyślnych. Z zewnątrz nadal wygląda tak samo, ale wejście, wersja i zależności zostały zmienione w środku. Dla ludzi jest to po prostu przełącznik; w przypadku automatyzacji jest to szeroki dryf behawioralny.

Można przesuwać wagę, ale nie można przesuwać wartości domyślnej.

Ważną zaletą modelu open source jest to, że wagi można kopiować, dublować, forkować i zapisywać w trybie offline. Problem polega na tym, że kopiowany jest plik, a nie domyślna ścieżka. Dopóki strona konsumencka nadal będzie uważać pewne zewnętrzne wejście za jedyną prawdę, niezależnie od tego, jak otwarta jest waga, na sposób działania nadal będą miały wpływ zasady zewnętrzne.

Jeszcze bardziej kłopotliwe jest to, że ta zmiana niekoniecznie musi natychmiast spowodować błąd. Wiele razy wydaje się, że nadal może działać, ale rezultaty są różne: jeden zestaw ocen został przekazany zwierciadłu A, a drugi został wstrząśnięty zwierciadłem B; jedna wersja jest dostępna lokalnie, ale po dotarciu do rurociągu staje się kolejnym zestawem poprawek; pod tą samą nazwą modelu rzeczywiste zachowanie zaczęło się odbiegać.

Trzeba tu rozróżnić dwie rzeczy. Problem łańcucha dostaw bardziej przypomina zarządzanie plikami i zarządzanie wersjami, a problem domyślnego routingu bardziej przypomina podejmowanie decyzji w czasie wykonywania. Ten pierwszy dba o to, czy istnieje kopia zapasowa, a drugi o to, jaką ścieżką żądanie powinno przejść jako pierwsze. Dopóki wartość domyślna jest zapisana zewnętrznie, akcje zewnętrzne mogą bezpośrednio zastąpić przepływ pracy.

Należy uzupełnić pin, lustro i trasę awaryjną.

Środki zaradcze nie są skomplikowane, ale niewiele osób uważa je za priorytet.

Wersja powinna być przypięta do konkretnego zatwierdzenia, skrótu lub jasnej wersji i nie polegać na nazwach takich jak najnowsza, które mogą dryfować przez długi czas. Najlepiej jest umieścić wagi, tokenizery, konfiguracje i obrazy wnioskowania razem w wewnętrznym magazynie, przynajmniej po to, aby mieć pewność, że będzie można je odbudować po odłączeniu sieci. Domyślne wejście musi mieć trasę rezerwową i nie może mieć tylko jednego adresu internetowego. Próbki ewaluacyjne i stare wyniki również muszą być przechowywane w aktach, w przeciwnym razie nie będzie jasne nawet „jak wiele się zmieniło”.

Wszystkie te rzeczy wyglądają jak szczegóły obsługi i konserwacji, ale w rzeczywistości przejmują kontrolę nad zewnętrznymi ustawieniami domyślnymi. Bez tej warstwy zamknięcia otwarte oprogramowanie przyniesie jedynie „pozory wolności”, ale nie „faktyczną sterowalność”.

Po upublicznieniu modelu open source tak naprawdę krucha jest nie sama waga, ale domyślna trasa. Dopóki wejście jest nadal kontrolowane przez domyślne wartości innych osób, przepływ pracy będzie nadal zakłócany po ponownym otwarciu modelu.