Back home

Настоящим прорывом китайской модели открытого исходного кода является сеть сотрудничества.

Вес может быть реализован, а обновления, обзоры и консенсус будут более хрупкими.

Говоря о том, «будет ли он запечатан» в модели с открытым исходным кодом, проще всего рассматривать файл веса как все.

После загрузки весов сама модель часто не исчезает так просто. Что легче сломать в первую очередь, так это сеть, которая вращается вокруг нее: зеркальные сайты, оценочные наборы, шаблоны вывода, сценарии тонкой настройки, исправления проблем, параметры развертывания по умолчанию и консенсус в сообществе, что «эта версия может работать, а эту версию трогать нельзя».

Та часть, которая может удариться о землю, меньше всего боится сломаться.

Пока модель с открытым исходным кодом попала в локальное хранилище, объектное хранилище или образ интрасети, независимо от того, насколько сжат внешний мир, файл обычно все еще находится там. Автономные копии, внутренние кэши и продукты исторических сборок — все это надолго отложит вопрос о том, «можно ли их еще использовать».

Это также самое большое различие между моделью с открытым исходным кодом и чистыми облачными сервисами. Как только облачный сервис блокируется, вход часто исчезает; даже если вышестоящая служба модели с открытым исходным кодом остановлена, имеющиеся в наличии веса, токенизатор и изображение вывода могут продолжать работать. Вопрос не в том, «есть ли оно у вас?» но «можете ли вы продолжать использовать его так же, как другие?»

Что действительно четко, так это отношения синхронизации

Тот факт, что модель может продолжать работать, не означает, что команда сможет и дальше идти в ногу с ней.

Обычно в первую очередь следует ослабить отношения синхронизации:

  • апстрим выпустил новую версию, но внутреннее зеркало не поспевало.
  • Набор оценок был пересмотрен, и результаты регрессии больше не могут быть сопоставлены со старыми записями.
  • Шаблон чата или токенизатор немного передвинут, но стиль вывода сильно изменился.
  • Определенное исправление затронуло только PR сообщества, а не имидж корпоративной интрасети.
  • Параметры квантования по умолчанию, длина контекста по умолчанию и параметры выборки по умолчанию отличаются друг от друга.

Эти вещи сами по себе не выглядят большими, но если сложить их вместе, «одна и та же модель» разобьется на несколько частей.

На данном этапе реальный вред, причиняемый внешними ограничениями, заключается не в том, чтобы стереть из мира весомый документ, а в том, чтобы разрушить тот факт, что «все смотрят на одно и то же». Команда по-прежнему говорит об одном и том же названии модели, но на самом деле они получают комбинированный пакет с разными версиями, разными шаблонами и разными параметрами.

Отзывы, исправления и опыт будут собраны вместе.

Как только модель с открытым исходным кодом входит в реальный рабочий процесс, реальной ценностью обычно становится не сам вес, а суждение, накопленное вокруг веса.

Какая версия более стабильна, какой токенизатор разбивает длинный текст, какой набор параметров выборки больше подходит для сценариев обслуживания клиентов, какой скрипт тонкой настройки усилит иллюзию — все эти действия основаны на непрерывном обмене. Пока сохраняется сеть сотрудничества, каждый может работать над одним и тем же базовым уровнем; как только сеть сотрудничества будет разрушена, каждая команда будет постепенно разрабатывать свою собственную частную версию.

Приватные версии вещь неплохая, но цена ползет вверх:

  • Возврат к исходному состоянию становится все труднее повторно использовать.
  • Анализ несчастных случаев становится все труднее согласовывать.
  • Исправлена ошибка, из-за которой патч становится все труднее синхронизировать.
  • Одна и та же проблема будет появляться неоднократно в разных командах.

На данный момент это выглядит так, будто «модель все еще существует», но на самом деле она превратилась в «множество локальных копий, которые практически невозможно использовать», и между ними нет общего пути обновления.

Чего действительно стоит опасаться, так это не блокировки, а форка

Модель с открытым исходным кодом сложно полностью запечатать, как онлайн-API, поскольку существует возможность тиражирования. Чего нам действительно следует опасаться, так это того, что после того, как внешнее давление нарушает распределение, ремонт и сотрудничество, модель начинает расходиться по ритмам разных организаций.

Когда появится больше форков, вопрос «можно ли это скачать?» уже не будет стоять перед вопросом. но «кто может гарантировать, что это все тот же тип вещей?» Этот вопрос напрямую увеличит стоимость доступа: нужно переделывать новые обзоры, заново объяснять старые ошибки, переупорядочивать различия версий, а команде приходится разрабатывать собственные стратегии отката и заморозки для каждой раздвоенной строки.

Устойчивость модели с открытым исходным кодом действительно выше, чем у чисто облачных сервисов; но ее уязвимость также очень очевидна: не в том, был ли убран вес, а в том, сможет ли сеть сотрудничества продолжать сохранять то же имя, что и одна и та же вещь.

FAQ

What to read next

Related

Continue reading