The Good Journal #7 - Het zijn jouw gegevens, niet hun dataset

4 juli 2024

The Good Journal #7 - Het zijn jouw gegevens, niet hun dataset

Of je nu schrijft, schildert, zingt, tekent, ontwerpt, berekent, rapporteert, presenteert of de theremin bespeelt, het is zeer waarschijnlijk dat je bestanden hebt die gerelateerd zijn aan deze bezigheden, en deze bestanden zijn jouw eigendom.

Bij The Good Cloud worden dergelijke bestanden veilig opgeslagen en zijn ze voor jou beschikbaar. Maar we gebruiken je bestanden nergens anders voor. Je werk wordt nooit onderdeel van een model als het bij ons is opgeslagen. Dit zorgt ervoor dat jouw werk niet gemakkelijk door een AI kan worden nagemaakt. Dit beschermt je tegen inbreuken op het auteursrecht door anderen. Zoals sommige auteurs en journalisten nu ondervinden.

In de afgelopen tijd is in de kleine lettertjes van clouddiensten het mogelijke gebruik van je gegevens in grote taalmodellen en visuele modellen opgenomen. Als je bijvoorbeeld Adobe Creative Cloud gebruikt, moet je je instellingen controleren. Als je je niet hebt afgemeld voor de "inhoudsanalyse", dan heb je hen toestemming gegeven om jouw werk te gebruiken in hun "technieken, zoals machine learning."

In december ging Dropbox een samenwerking aan met OpenAI. Ze beweren dat gegevens alleen worden gedeeld als gebruikers een specifieke functie activeren en in dergelijke gevallen kunnen we er alleen maar op vertrouwen dat dit hetzelfde betekent als wat wij onszelf voorstellen.

De update van het privacybeleid van Google in 2023 had een vergelijkbaar effect. Ze behouden zich nu het recht voor om je gegevens en gedrag te scrapen. Hoewel dit misschien beperkt blijft tot openbaar beschikbare gegevens, moeten we er opnieuw op vertrouwen dat we elkaar begrijpen wat we daarmee bedoelen. Met Microsofts samenwerking met OpenAI hebben jouw gegevens misschien maar weinig veilige havens. Zelfs als we kunnen vertrouwen op dit wederzijdse begrip, dring ik er bij jullie op aan om goed na te denken over bij wie je je gegevens opslaat. Behoud de controle over je eigendom.

Dit is niet om mee te doen aan de algemene verontwaardiging over AI zelf. Eerlijk gezegd vind ik dat het hele debat te veel gericht is op een symptoom in plaats van een oorzaak. De haast om AI aan te bieden wordt gedreven door overweldigende financiële prikkels die leiden tot verkeerde kortere wegen, en zoals met alle nieuwe opkomende technologie, is misbruik aanvankelijk welig tierend.

Persoonlijk zie ik veel potentieel in de juiste methoden om een dataset of model te voeden en het geïnformeerde gebruik van de resulterende hulpmiddelen. Dat gezegd hebbende. Deelname zou opt-in moeten zijn en had dat ook moeten zijn, in plaats van opt-out.

Binnen onze service en de Nextcloud software die we gebruiken, zul je steeds meer opties vinden die manieren bieden om bepaalde AI-services te integreren, zoals ChatGPT of LocalAI. Dit blijft altijd opt-in en heeft alleen tot gevolg dat de tool beschikbaar is binnen de service. Het kan je helpen om dat rapport dat je aan het schrijven bent te corrigeren, maar het zal nooit het gedicht dat je hebt opgeslagen scannen of gebruiken.

En, heel belangrijk, je hoeft ons niet alleen op ons woord te geloven. Je kunt altijd de Nextcloud community binnenstappen en de code eens goed bekijken: https://github.com/nextcloud

Dus, gaan we AI als een dienst aanbieden?

Nee, hoewel we het in eerste instantie hebben overwogen, hebben we besloten om een dienst als LocalAI gehost op ons platform niet aan te bieden. We hebben geen groot taalmodel gevonden dat geen dubieus ontstaansverhaal heeft, en we hebben er ook geen gevonden die niet af en toe iets gevaarlijks of ronduit verkeerds zou verkondigen. We zullen je echter wel helpen om uit te zoeken hoe je kunt verbinden wat je wilt verbinden.

Zorg goed voor wat je creëert. Het is kostbaar.

Afbeelding: EasyDiffusion SD5

Tekst spelling: AlleenOffice autocorrectie

Tekst kopiëren bewerken: OpenAI's chatGPT 4 en Grammarly