Back home

Китайская модель открытого исходного кода, скорее всего, будет замедлена, чем заблокирована.

Что действительно становится хрупким, так это распространение, обновления и цепочки зависимостей.

Когда такого рода дискуссии попадают в проект, они в конечном итоге сводятся к более холодному предложению: трудно полностью стереть модель с открытым исходным кодом. Что действительно становится хрупким в первую очередь, так это сборочная линия, вращающаяся вокруг модели. Пока один из файлов модели, изображений, проверочных значений, среды вывода и сценариев оценки не работает, команда будет чувствовать не «существует ли эта модель еще в мире», а «можно ли воспроизвести это обновление».

Что действительно застревает, так это входы и обновления.

Официальную опеку легче всего закрыть в первую очередь. Веб-страницы, API, страницы загрузки, зеркальные сайты (при условии, что вход централизован), платежи, юридические вопросы, CDN, региональные ограничения и политики учетных записей — все это может сузить его. То же самое справедливо и для вывода облаков. Как только бизнес передает возможности модели на аутсорсинг определенной точке хостинга, блокаде не требуется удалять модель из мира. Пока будут ужесточаться доступность, квоты, платежи и региональные ограничения, система начнет трястись.

Но как только вес рассеялся, ситуация меняется. Модель с открытым исходным кодом не только живет на определенной домашней странице, но также живет на локальных дисках, в кэшах сборок, хранилищах изображений и хранилищах артефактов, созданных командой. Что вы можете контролировать, так это скорость распространения, а не количество уже существующих копий. Чтобы прояснить ситуацию, самое большое влияние зачастую оказывает не «сможете ли вы еще загрузить определенную версию», а «сможете ли вы стабильно получать тот же набор токенизаторов, шаблонов чатов, пакетов квантования и инструкций по зависимостям в будущем».

Здесь он также наиболее недооценен. При первом запуске модели кажется, что риск миновал; настоящая беда часто возникает во второй раз. Во второй раз, когда я захотел откатиться, изображения уже не было; во второй раз, когда я захотел воспроизвести, формат количественного определения изменился; во второй раз, когда я захотел обновиться, код вывода и весовая версия не совпадали; во второй раз, когда я хотел проверить, набор оценок и сценарий предварительной обработки были изменены. На первый взгляд не хватает только одной ссылки для скачивания, но на самом деле не хватает полного набора повторяемых цепочек поставок.

Так что этот тип «печати» больше похож на замедление, чем на удаление. Что может быть существенно ослаблено, так это скорость связи, доступ к облаку, синхронизация версий и экологическая уверенность; что трудно полностью стереть, так это распространившиеся взвешенные копии, возможности локального развертывания и возможности вторичного распространения. Как только модель с открытым исходным кодом попадает на достаточное количество машин, риск меняется с «может ли она существовать» на «может ли она стабильно развиваться».

И здесь отечественные команды, скорее всего, промахнутся. После интеграции модели в продукт легко сосредоточиться только на первом раунде эффектов и забыть, что модель на самом деле является зависимостью. Если зависимость имеет только одну точку входа, эта единственная точка станет контрольной точкой; если зависимость не имеет блокировки версий, обновления станут случайным событием; если зависимость не имеет автономной копии, так называемая «собственная способность» будет раскрыта после сбоя определенного зеркала.

Более стабильный подход — не воображать, что блокады не будет, а заранее разбить блокаду на несколько доступных небольших проблем: вес и время выполнения хранятся отдельно, адрес загрузки и проверочное значение сохраняются вместе, среда вывода создается для перестройки в автономном режиме, результаты оценки архивируются по версиям, и путь отката так же ясен, как и путь выпуска. Таким образом, даже если восходящий поток внезапно отключится, продукт потеряет только один вход, и все возможности не будут отключены одновременно.

Настоящий ров модели с открытым исходным кодом никогда не заключался в том, что «никто не смеет ею управлять», но «когда ею управляют, ею уже трудно управлять до определенной степени». Есть много входов, которые можно затянуть, а разошедшиеся копии сложно восстановить.

FAQ

What to read next

Related

Continue reading