Back home

Wat echt als eerste in het open source-model aan de orde komt, is de kwestie van de toeleveringsketen.

Nadat het gewicht openbaar is gemaakt, zal eerst de focus komen te liggen op distributie, updates en afhankelijkheden.

Als zo’n onderwerp eenmaal als “verzegeld” is geschreven, wordt de aandacht gevestigd op een al te dramatisch beeld. De meer algemene veranderingen in het project zijn minder dramatisch: de openbare downloadbron wordt instabiel, spiegelsites verschijnen, een bepaalde versie wordt uit de schappen gehaald, het ritme van voortdurende updates wordt onderbroken en de redeneringsketen in de handen van het team moet plotseling zichzelf vasthouden.

De hostinglaag neemt als eerste de druk op zich

Hoe meer het open source-model wordt besproken, hoe gemakkelijker het is om één ding duidelijk te zien: wat rechtstreeks kan worden beïnvloed door beleid, exportcontroles en platformregels zijn vaak niet de gewogen documenten die zijn verspreid, maar publieke hosting, online gevolgtrekking, versiedistributie en standaardingangen.

Dit betekent dat, hoewel het voelt als “verzegeld”, het pad dat feitelijk is afgesneden vaak het gemakkelijkste pad is. Wat vroeger een eenvoudig proces was van het ophalen van een URL, het opzetten van een hostinginterface en het oproepen ervan, veranderde plotseling in het vinden van een afbeelding, het toevoegen van een handtekening, het controleren van de hash, het controleren van de licentie en het bevestigen van de terugdraaiversie. De acties lijken misschien klein, maar als ze met elkaar verbonden zijn, vormen ze een complete supply chain.

Zodra de versie is gevorkt, verklaart de naam het probleem niet langer.

Het moeilijkste deel van het open source-model is nooit “of die er is”. Zodra het gewicht zich verspreidt naar meerdere afbeeldingen, meerdere organisatorische magazijnen en meerdere verfijningsbranches, zullen verschillende gedragingen onder dezelfde naam groeien.

Op dit moment is het niet langer voldoende om te discussiëren “of het model er nog is”. De lastiger vraag is: welke is de hoofdlijn, welke is slechts een spiegelbeeld, welke is twee keer getraind en welke heeft nog steeds het oorspronkelijke redeneergedrag. De naam kan nog steeds naar hetzelfde project verwijzen, maar de output begint uiteen te lopen. Als het team op dit moment “dezelfde naam” nog steeds als “hetzelfde” beschouwt, zullen de online resultaten vroeg of laat afwijken.

Dit is ook het grootste verschil tussen open source-modellen en closed source-API’s. De closed source API is losgekoppeld en de prestaties zijn zeer eenvoudig; het open source-model is gesplitst en aan de oppervlakte draait de service nog steeds, maar achter de schermen zijn de versie-, afhankelijkheden en gedragsgrenzen veranderd. Wat echt verontrustend is, is vaak niet het falen, maar ‘het lijkt nog steeds te werken’.

Wat echt moet worden opgelost, is de bron-, rollback- en offline herhaling.

Wanneer dit soort veranderingen in het project plaatsvinden, zijn het eerste dat moet worden gecompenseerd niet emoties, maar drie dingen: bron, terugdraaien en offline herhaling.

De bron moet herleidbaar zijn naar specifieke magazijnen, specifieke inzendingen en specifieke gewichtsdocumenten. Het terugdraaien moet kunnen terugkeren naar de vorige versie van het gedrag, en niet alleen naar een naam. Offline reproductie moet dezelfde reeks experimenten opnieuw kunnen uitvoeren wanneer het netwerk trilt, de spiegel verloren gaat of het stroomopwaartse pakket wordt verwijderd.

Veel teams hebben meestal het gevoel dat deze dingen ver van hen verwijderd zijn. Pas op een dag dat een upstream-update de uitvoerstijl verandert, of een bepaalde beeldsynchronisatie traag is, ontdekken ze dat het probleem helemaal niet in de modelcapaciteit zit, maar in de afhankelijkheidsketen die niet als een eersteklas burger wordt beheerd. Hoe opener het model is, hoe duidelijker dit is. Want wat open source met zich meebrengt is niet een steeds stabiele ‘vrije toegang’, maar een steeds langere supply chain.

Het meest fysieke deel is meestal niet het lichaam van het model.

Als het om een ​​productieomgeving gaat, is de meest waarschijnlijke fout meestal niet de gewichtsontologie, maar de standaardinvoer, automatische updates en impliciete afhankelijkheden.

Als een team een ​​bepaald online portaal als enige bron beschouwt, kan het dit vandaag nog oproepen, maar moet het morgen mogelijk tijdelijk op zoek gaan naar een vervanger; als het een spiegelstation als de standaardwaarheid beschouwt, zal versie-drift stilletjes in training en evaluatie terechtkomen; als het updateritme te strak is, is de gedragsstabiliteit van vandaag niet duidelijk en zal de nieuwe versie van morgen online zijn.

Dit soort problemen lijken dus op internationale politiek, maar als het om techniek gaat, lijkt het meer op supply chain governance. Wie de invoer beheert, wie verantwoordelijk is voor de ondertekening, wie het terugdraaien definieert, wie de oude versie opslaat en wie offline opnieuw kan opbouwen: dit zijn de grenzen die de levering zullen blijven beïnvloeden. Nadat het model zelf openbaar is gemaakt, zal de ruimte die overblijft voor externe acties kleiner worden; de ruimte die het team overblijft om zelf lessen te verzinnen wordt groter.

Of het open source-model ‘verzegeld’ zal zijn, is een beetje een beperkte vraag. Een realistischer oordeel is: hoe opener het is, hoe moeilijker het is om het met één enkele handeling onder controle te houden; maar hoe opener het is, hoe meer het versies, bronnen, rollbacks en offline herhalingen moet beheren. Als deze toeleveringsketen niet onder controle wordt gehouden, zal elke externe fluctuatie worden versterkt tot een ongeluk dat lijkt op een ‘modelongeluk’.