Categorieën
Auteursrecht Technologie- & IT-Recht

Auteursrechtelijke uitdagingen bij het trainen van generatieve AI-modellen in Duitsland

Het gebruik van generatieve AI-modellen zoals ChatGPT, DALL-E of Stable Diffusion is de afgelopen jaren enorm toegenomen. Deze modellen kunnen op basis van gebruikersinstructies creatieve inhoud genereren, zoals teksten, afbeeldingen of muziekstukken. Deze mogelijkheid voor autonome creativiteit is gebaseerd op het feit dat de AI-modellen van grote datasets hebben “geleerd” hoe ze dergelijke inhoud kunnen creëren. Een aanzienlijk deel van deze datasets is auteursrechtelijk beschermd, wat leidt tot aanzienlijke juridische uitdagingen.

Technologische Grondslagen

Generatieve AI-modellen zijn gebaseerd op machine learning, met name op diepe kunstmatige neurale netwerken (ANN’s), die worden getraind om complexe patronen in grote datasets te herkennen. Deze modellen gebruiken leerprocessen zoals gesuperviseerd, ongesuperviseerd en versterkend leren om hun capaciteiten te verbeteren. Een belangrijk aspect hierbij is de pre-training en fine-tuning van de modellen: Het basismodel wordt eerst getraind op een algemene dataset (pre-training) en vervolgens aangepast aan specifiekere taken of stijlen (fine-tuning). Dit stelt de modellen in staat flexibel te worden ingezet voor verschillende toepassingen.

Auteursrechtelijke Aspecten

Volgens een recente studie van Dornis en Stober komen er tijdens het trainen van generatieve AI-modellen talrijke auteursrechtelijk relevante handelingen voor. Deze omvatten:

  • Verzameling, voorbereiding en opslag van trainingsdata: Deze reproductie van auteursrechtelijk beschermde werken vindt plaats tijdens het maken van corpora die dienen als basis voor AI-training.
  • Training van generatieve AI-modellen: Tijdens het trainingsproces, met name tijdens pre-training en fine-tuning, vinden er reproducties van de werken plaats “binnenin” het model. Zelfs als de data niet expliciet worden opgeslagen, kunnen ze toch door het model worden gememoriseerd, wat als reproductie onder de auteurswet wordt beschouwd.
  • Gebruik van generatieve AI-modellen: Gebruikers die generatieve AI-systemen toepassen, produceren door de modellen nieuwe inhoud die op de beschermde trainingsdata kan zijn gebaseerd. Dit vormt het gebruik van auteursrechtelijk beschermde werken.
  • Openbare toegankelijkheid: Wanneer generatieve AI-modellen beschikbaar worden gesteld voor gebruik, hetzij via gebruikersapplicaties of als download, is er sprake van een openbare toegankelijkheid van de werken die voor het trainen zijn gebruikt en in het model zijn gereproduceerd.

Juridische Beperkingen en Uitdagingen

De huidige auteursrechtelijke beperkingen dekken de handelingen die plaatsvinden bij het trainen van generatieve AI-modellen slechts in een paar, vaak praktisch irrelevante gevallen. In het bijzonder wordt benadrukt dat volgens het onderzoek de beperking voor tekst- en datamining (TDM) niet van toepassing is. Generatieve AI-modellen gebruiken de trainingsdata uitgebreider dan TDM, aangezien ze niet alleen semantische, maar ook syntactische informatie gebruiken en deze in een vectorruimte representeren. Volgens de analyse leidt dit tot een uitgebreide reproductie van inhoud die verder gaat dan wat TDM zou dekken.

DSM-Richtlijn

De DSM-richtlijn, die de juridische basis vormt voor TDM, was niet ontworpen voor de technologische ontwikkelingen van creatieve en productieve AI-systemen en sluit daarom expliciet hun toepassing uit. Evenzo houdt de AI-verordening geen rekening met deze specifieke verschillen, wat leidt tot juridische grijze gebieden.

Relevante Auteursrechtelijke Beperkingen en Hun Toepassing

In het Duitse auteursrecht zijn er verschillende beperkingbepalingen die onder bepaalde voorwaarden de gebruik van auteursrechtelijk beschermde werken toestaan. In de context van het trainen van generatieve AI-modellen zijn de volgende beperkingen met name relevant:

  • § 44a UrhG – Tijdelijke Reproductiehandelingen: Deze beperking staat tijdelijke reproducties toe die vluchtig of begeleidend zijn en een integraal en essentieel onderdeel vormen van een technisch proces, mits ze geen zelfstandige economische waarde hebben. Volgens het onderzoek van Dornis en Stober is deze beperking bij het trainen van AI-modellen echter slechts beperkt van toepassing, aangezien de reproducties niet alleen vluchtig zijn, maar vaak van een meer langdurige aard en verder gaan dan wat technisch noodzakelijk is.
  • § 60d UrhG – Tekst- en Datamining (TDM): § 60d UrhG staat reproducties van werken toe voor het doel van tekst- en datamining voor niet-commercieel wetenschappelijk onderzoek. Voor generatieve AI-modellen is deze beperking echter nauwelijks relevant, aangezien commercieel gebruik van dergelijke modellen niet door § 60d wordt gedekt. Het onderzoek benadrukt ook dat generatieve modellen niet alleen semantische informatie extraheren, maar ook syntactische structuren gebruiken, wat verder gaat dan de beperking van TDM.
  • §§ 60a tot 60c UrhG – Gebruik voor Onderwijs, Wetenschap en Instellingen: Deze beperkingen staan bepaalde gebruik van auteursrechtelijk beschermde werken toe voor educatieve en wetenschappelijke doeleinden. Ze zijn echter beperkt tot niet-commerciële contexten en hebben meestal geen directe invloed op het trainen van generatieve AI-modellen, aangezien de meeste modellen ook commercieel worden gebruikt.
  • § 44b UrhG – Tijdelijke Reproducties in de Context van Netwerktoegang: § 44b UrhG staat tijdelijke reproductiehandelingen toe die nodig zijn om toegang tot netwerken en hun inhoud mogelijk te maken, mits deze handelingen technisch vereist zijn en geen zelfstandige economische waarde hebben. Het onderzoek beoordeelt deze beperking als bijzonder relevant, maar slechts beperkt toepasbaar op generatieve AI-modellen. De belangrijkste reden is dat de reproducties die plaatsvinden tijdens AI-training vaak niet slechts tijdelijk zijn, maar permanent in het model worden opgeslagen, waardoor ze buiten de reikwijdte van § 44b vallen. De modellen onthouden vaak de structuur en inhoud van de trainingsdata, wat een langdurig gebruik vertegenwoordigt en niet slechts een vluchtige technische noodzaak.

Als gevolg hiervan vallen veel van deze reproducties in juridische grijze gebieden—of zelfs duidelijk buiten de wettelijke beperkingen, wat leidt tot aanzienlijke juridische onzekerheden.

Toepasselijk Recht en Internationale Jurisdictie

Het onderzoek benadrukt dat het openbaar toegankelijk maken van AI-modellen voor gebruik door Duitse gebruikers—bijvoorbeeld via de OpenAI-website van ChatGPT—de toepassing van het Duitse auteursrecht en de bevoegdheid van Duitse rechtbanken kan activeren. Aangezien de trainingsdata auteursrechtelijk beschermd zijn en “binnenin” de modellen worden gereproduceerd, vormt dit een relevant gebruik onder de auteurswet.

Conclusie en Vooruitzichten

Het gebruik van generatieve AI-modellen brengt aanzienlijke juridische onzekerheden met zich mee, met name wat betreft inbreuken op het auteursrecht tijdens het trainen en het toepassen van deze modellen. Het onderzoek voor de Duitstalige rechtsruimte laat zien dat het huidige juridische kader onvoldoende is om de uitdagingen die de snelle technologische ontwikkeling met zich meebrengt adequaat aan te pakken.

De kwestie van auteursrecht bij het trainen van AI met gegevens van derden is dominant en vormt momenteel het grootste deel van de vragen die ik ontvang. Er wordt verwacht dat dit probleem de komende jaren verder zal toenemen, waardoor het dringend noodzakelijk is om duidelijke wettelijke regels vast te stellen om zowel de rechten van auteursrechthebbenden te beschermen als innovatie op het gebied van AI te bevorderen.

De auteurs concluderen met name dat de huidige auteursrechtelijke beperkingen, met name § 44b UrhG, niet voldoende zijn om de uitgebreide reproducties en gebruik van auteursrechtelijk beschermde werken door generatieve AI-modellen te rechtvaardigen. Terwijl sommige beperkingen in het Duitse auteursrecht, zoals § 44a UrhG en § 60d UrhG, kortdurende en specifieke gebruik toestaan, blijven de specifieke vereisten en de langdurige opslag van de modellen onbenoemd in deze bepalingen.

Advocaat Jens Ferner

Door Advocaat Jens Ferner

Ik ben een gespecialiseerde advocaat voor strafrecht + gespecialiseerde advocaat voor IT-recht en wijd mijn professionele leven volledig aan strafrechtelijke verdediging - en IT-recht als advocaat voor creatieve & digitale bedrijven en greentech. Voordat ik advocaat werd, was ik softwareontwikkelaar. Ik ben auteur in een gerenommeerd StPO-commentaar en in vakbladen.

Ons kantoor is gespecialiseerd in strafrechtelijke verdediging, witteboordenstrafrecht en IT-recht. Let op ons werk in kunstrecht, digitaal bewijs en softwarerecht.

Let op: Voor bedrijven zijn wij landelijk actief, voor consumenten uitsluitend in NRW voor strafverdediging + OWI's!