Chardet LLM Herschrijving Ontketent Licentie-Oorlog

Wat gebeurde er met Chardet?

Het Python-project chardet, een library voor character encoding detection, kreeg plotseling een volledige herschrijving. Versie 7.0 werd door een nieuwe maintainer volledig gegenereerd met behulp van een LLM. De oorspronkelijke auteur Mark Pilgrim protesteerde: dit was niet de bedoeling van de open-source licentie.

Het project stond jarenlang stil. De nieuwe maintainer besloot de code te moderniseren met AI. Maar in plaats van de originele LGPL-licentie te behouden, werd het project herlicentieerd naar MIT. Dat riep serieuze vragen op over de juridische status van AI-gegenereerde code.

Wie heeft er gelijk?

Pilgrim stelt dat je LGPL-code niet zomaar kunt herschrijven en herlicensieren. De LGPL is ontworpen om gebruikers vrije toegang te geven tot de broncode. Als je de code vervangt door een AI-versie, blijft de oorspronkelijke licentie gelden volgens open-source experts.

De nieuwe maintainer argumenteert dat de AI een volledig nieuwe implementatie heeft gemaakt. Geen copy-paste, maar een fresh start. En MIT is permissiever dan LGPL, dus gebruikers krijgen meer vrijheden. Maar juridisch is dit onontgonnen terrein.

Wat betekent dit voor andere projecten?

Dit geval toont een groter probleem. AI-tools zoals Claude en GPT-4 kunnen code herschrijven in seconden. Maar wie bezit die code? De oorspronkelijke auteur? De prompt-schrijver? Het AI-model?

Open-source projecten worstelen hier al mee. Als een AI een library herschrijft, kan de nieuwe versie onder een andere licentie komen te vallen. Dat kan de intentie van de oorspronkelijke auteur ondermijnen.

Wat kunnen ontwikkelaars doen?

Project maintainers moeten duidelijke richtlijnen opstellen. Contributer agreements moeten AI-gegenereerde code expliciet vermelden. En voor elk project dat AI gebruikt om code te herschrijven: documenteer de oorsprong.

De Linux Foundation werkt al aan standaarden voor AI-gegenereerde code. Tot die tijd blijven projecten zoals chardet in een juridische schemerzone.

Is AI-gegenereerde code auteursrechtelijk beschermd?

In de VS bepaalde de Copyright Office dat AI-gegenereerde werken geen auteursrecht kunnen claimen. Maar dat geldt voor nieuwe werken, niet voor bewerkingen van bestaande code. De rechtszaak rond chardet kan hier precedent scheppen.

Mag je LGPL-code herschrijven met AI?

Technisch ja, maar de licentievereisten blijven bestaan. De LGPL vereist dat afgeleide werken onder dezelfde voorwaarden beschikbaar blijven. Een herschrijving met AI is waarschijnlijk nog steeds een afgeleid werk.

Wat moeten bedrijven doen?

Bedrijven die open-source gebruiken moeten voorzichtig zijn met AI-herschrijvingen. Documenteer de oorsprong van elke regel code. En raadpleeg juridisch advies voordat je projecten herlicentieert.

De context

De AI-codering revolutie versnelt. Projecten zoals NVIDIA's AI tools maken code generatie toegankelijk. Maar zoals onze analyse over enterprise AI-beveiliging liet zien, brengt elke nieuwe mogelijkheid nieuwe risico's met zich mee.

Ben je ontwikkelaar? Check je dependencies. En lees de licenties van projecten die je gebruikt. De chardet-zaak is waarschijnlijk pas het begin.