Back home

Риски модели с открытым исходным кодом в первую очередь падают на уровень доступа.

Название модели изменится, но что действительно должно быть стабильным, так это вес, маршрутизация и запасной вариант.

В последние несколько дней велась дискуссия о том, будут ли модели с открытым исходным кодом застрять в условиях ужесточения политики США. Первое, что меняется в инженерии, — это не возможности модели, а доступность по умолчанию. Модель все еще там, как и документы. Что действительно волнует в первую очередь, так это адрес получения, источник зеркала, хостинговая платформа, условия лицензии и региональная доступность. Первое, с чем часто сталкиваются люди, занимающиеся доступом к работе, это не «модель недостаточно сильна», а «можем ли мы сегодня получить ее стабильно?»

Достижимость по умолчанию сначала ухудшается

Раньше самая неприятная проблема при доступе к модели заключалась в том, что «ту же модель можно было загрузить вчера, но сегодня она внезапно получила ошибку 403». Изменение такого типа выглядит как небольшое колебание в цепочке поставок, но на самом деле перетягивает все звено в нестабильное состояние: нужно повторить загрузку веса, переключить источник образа, пересчитать контрольную сумму, переупаковать образ развертывания, а также станет недействительным кэш в CI. На первый взгляд, только этап создания модели становится хрупким, но на самом деле из системы отнимается предпосылка «удобства использования».

Модель с открытым исходным кодом часто понимают так: «после того, как код станет открытым, он больше не будет контролироваться другими». Это предложение верно лишь наполовину. Открытый исходный код не означает, что он доступен по умолчанию, а видимость на складе не означает, что производственную среду можно стабильно запустить. У кого он хостится, в каком регионе он существует, менялась ли лицензия и есть ли ограничения на частоту скачиваний. Как только эти детали блокируются платформой, политиками или бизнес-условиями, команда видит не «модель исчезает», а «вещи, которые были легко доступны, начинают становиться инфраструктурой, которую необходимо поддерживать».

Интерфейс модели будет увеличен до границ системы

Раньше, когда я прописывал все детали в маршрутизации модели, самым трудным было не то, что оценка отставала на два или три балла, а то, что интерфейс модели был недостаточно стабильным. После замены базы привычки подсказок, структура вывода, формат вызова инструментов и поведение длинного контекста изменятся соответствующим образом. Название модели вроде бы не изменилось, но парсер, оценочный набор, журнал повторов и обработку сбоев в системе приходится перезапускать. В тот момент легче всего было разоблачить то, что система приняла «определенную модель» за «определенную способность».

Это также наиболее игнорируемая область в дискуссиях, связанных с моделями с открытым исходным кодом. Что действительно ценно, так это не само имя, а набор заменяемых возможностей, которые оно может предоставить: завершение, классификация, извлечение, диалог, вызов инструмента, длинное резюме статьи и генерация кода. Пока уровень доступа связывает эти возможности с конкретными моделями, любые последующие изменения будут увеличивать затраты на миграцию. С другой стороны, если уровень интерфейса сначала сжать в стабильный контракт, базу можно будет заменить как зависимость, и риск будет ограничен лишь в ограниченной степени.

Маршрутизация и резервный вариант важнее существительных

Будет ли модель с открытым исходным кодом «запечатана» или нет, на конечную систему обычно влияет не название модели, а наличие выхода. Если команда помещает все задачи в одну удаленную модель, любые географические ограничения, ограничения доступа или изменения в бизнес-стратегиях напрямую приведут к прерыванию бизнеса. Напротив, пока присутствуют локально запускаемые модели, резервные источники хостинга, пулы моделей с различными уровнями возможностей и воспроизводимые оценочные наборы, внешние ограничения в лучшем случае будут увеличивать затраты на переключение и не сделают систему немедленно недоступной.

Поэтому, вынося суждения на уровне модели, лучше всего не просто спрашивать «какая модель сильнее», но и спрашивать: «Можно ли эту цепочку возможностей заменить базовой?» Можно ли хранить гири на контролируемом складе? Могут ли зависимости быть зафиксированы в фиксированных версиях? Можно ли объединить маршрутизацию, кэширование, воспроизведение и откат в полный набор действий? Эти вопросы ближе к реальной границе, чем название модели. Риск ограничения модели сначала не исчезнет, ​​но сначала изменится достижимость по умолчанию; и система должна поддерживать не модель, а набор возможностей, которые могут предоставляться постоянно.

FAQ

What to read next

Related

Continue reading