Back home

실제로 오픈 소스 모델에 가장 먼저 들어가는 것은 공급망 문제입니다.

가중치가 공개된 후에는 배포, 업데이트 및 종속성이 먼저 초점이 됩니다.

그런 주제를 '봉인’이라고 쓰면 지나치게 드라마틱한 그림이 눈길을 끈다. 프로젝트에서 보다 일반적인 변경 사항은 덜 극적입니다. 공개 다운로드 소스가 불안정해지고, 미러 사이트가 나타나기 시작하고, 특정 버전이 선반에서 제거되고, 지속적인 업데이트의 리듬이 중단되고, 팀의 손에 있는 추론 체인이 갑자기 자체적으로 유지되어야 합니다.

호스팅 계층이 먼저 압력을 받습니다.

오픈 소스 모델에 대해 더 많이 논의할수록 한 가지를 명확하게 보기가 더 쉽습니다. 즉, 정책, 수출 통제 및 플랫폼 규칙에 의해 직접적으로 영향을 받을 수 있는 것은 배포된 가중치 문서가 아닌 공개 호스팅, 온라인 추론, 버전 배포 및 기본 입구인 경우가 많습니다.

봉인된 것처럼 느껴지지만 실제로는 끊어진 길이 가장 쉬운 길인 경우가 많다는 뜻이다. URL을 끌어오고, 호스팅 인터페이스를 설정하고, 한 번 호출하는 간단한 과정이 갑자기 이미지 찾기, 서명 추가, 해시 확인, 라이선스 확인, 롤백 버전 확인으로 바뀌었습니다. 행동은 작게 보일 수 있지만 연결되면 완전한 공급망을 형성합니다.

버전이 포크되면 이름으로는 더 이상 문제를 설명할 수 없습니다.

오픈소스 모델에서 가장 어려운 부분은 결코 “존재하는지 여부”가 아닙니다. 여러 이미지, 여러 조직 창고, 여러 미세 조정 지점으로 가중치가 분산되면 동일한 이름 아래 다양한 동작이 성장하게 됩니다.

현시점에서는 "그 모델이 아직 존재하는지"를 논하는 것만으로는 더 이상 부족하다. 더 골치 아픈 질문은 어느 것이 메인 라인인지, 어느 것이 단지 거울 이미지인지, 어느 것이 두 번 훈련되었는지, 어느 것이 여전히 원래 추론 동작을 유지하는지입니다. 이름은 여전히 ​​동일한 프로젝트를 가리킬 수 있지만 출력이 분기되기 시작했습니다. 이때도 팀이 여전히 '동일한 이름’을 '동일한 것’으로 간주한다면 온라인 결과는 조만간 어긋나기 마련이다.

이는 오픈 소스 모델과 폐쇄 소스 API의 가장 큰 차이점이기도 합니다. 폐쇄 소스 API는 연결이 끊어져 있으며 성능은 매우 간단합니다. 오픈 소스 모델은 두 갈래로 나누어져 있으며 표면적으로는 서비스가 계속 실행되고 있지만 이면에서는 버전, 종속성, 동작 경계가 변경되었습니다. 정말로 불안한 것은 실패가 아니라 "여전히 효과가 있는 것 같다"는 것입니다.

정말 고쳐야 할 부분은 소스, 롤백, 오프라인 반복입니다.

프로젝트에 이런 변화가 왔을 때 가장 먼저 보완해야 할 것은 감정이 아니라 소스, 롤백, 오프라인 재발이라는 세 가지다.

출처는 특정 창고, 특정 제출물, 특정 중량 문서까지 추적 가능해야 합니다. 롤백은 이름뿐만 아니라 이전 버전의 동작으로 돌아갈 수 있어야 합니다. 오프라인 재생은 네트워크가 지터링되거나 미러가 손실되거나 업스트림 패킷이 삭제될 때 동일한 실험 라운드를 다시 실행할 수 있어야 합니다.

많은 팀은 대개 이러한 것들이 자신과 거리가 멀다고 느낍니다. 어느 날 업스트림 업데이트로 인해 출력 스타일이 변경되거나 특정 이미지 동기화가 느려지고 나서야 문제가 모델 기능에 전혀 있는 것이 아니라 일류 시민으로 관리되지 않는 종속성 체인에 있다는 사실을 발견하게 됩니다. 모델이 오픈 소스로 제공될수록 이는 더욱 분명해집니다. 오픈소스가 가져오는 것은 항상 안정적인 '무료 진입’이 아니라 점점 더 길어지는 공급망이기 때문입니다.

가장 물리적인 부분은 일반적으로 모델의 신체가 아닙니다.

프로덕션 환경에서 잘못될 가능성이 가장 높은 곳은 일반적으로 가중치 온톨로지가 아니라 기본 항목, 자동 업데이트 및 암시적 종속성입니다.

팀이 특정 온라인 포털을 유일한 소스로 간주하는 경우 오늘은 계속 호출할 수 있지만 내일 일시적으로 대체 포털을 찾아야 할 수도 있습니다. 미러 스테이션을 기본 진실로 간주하면 버전 드리프트가 훈련 및 평가에 조용히 몰래 들어갈 것입니다. 업데이트 리듬이 너무 빡빡하면 오늘의 동작 안정성이 명확하지 않으며 내일의 새 버전이 온라인에 게시될 것입니다.

따라서 이런 종류의 문제는 국제 정치처럼 보이지만 엔지니어링의 경우 공급망 거버넌스와 더 유사해 보입니다. 항목을 제어하는 ​​사람, 서명을 담당하는 사람, 롤백을 정의하는 사람, 이전 버전을 저장하는 사람, 오프라인으로 다시 빌드할 수 있는 사람 등이 전달에 계속 영향을 미치는 경계입니다. 모델 자체가 공개된 후에는 외부 활동을 위해 남겨진 공간이 줄어들 것입니다. 팀이 스스로 수업을 구성할 수 있는 공간이 더 커질 것입니다.

오픈 소스 모델이 "봉인"될 것인지 여부는 다소 좁은 질문입니다. 보다 현실적인 판단은 다음과 같습니다. 오픈 소스가 많을수록 단 한 번의 조치로 이를 억제하기가 더 어려워집니다. 그러나 오픈 소스가 많을수록 버전, 소스, 롤백 및 오프라인 반복을 관리해야 하는 필요성이 더 커집니다. 이 공급망이 봉쇄되지 않으면 어떤 외부 변동도 '모범사고’로 보이는 사고로 증폭될 것이다.