Brug af data til udvikling af AI

AI-løsninger ”lever” af store datamængder, og det er derfor vigtigt at have styr på, hvilke data AI trænes på og løbende ”fodres” med, så der ikke sker brud på ophavsrettigheder eller databeskyttelsesreglerne. Dette gør sig både gældende i forhold til brug af andres og egne data.

AI-systemer er afhængige af store datamængder, hvilket først og fremmest gør sig gældende i forbindelse med træning, hvor systemet skal lære mønstre fra store datasæt, forbedre sin præcision, tilpasse sig specifikke opgaver, håndtere komplekse problemer, forblive opdateret under ændrede omstændigheder samt reducere fejl og ubevidste skævheder (bias). Data bruges også i det løbende AI-arbejde, hvor brugerens ”prompts” kan indeholde billeder, tekst, video mv., der er IP-beskyttet, og/eller personoplysninger.

Når data bruges i en AI-kontekst, er det afgørende at have styr på, om man har ret til at bruge de pågældende data til træning, ”prompts” mv. Hvis man ikke har overblik over og indblik i data, risikerer man at krænke IP-rettigheder eller behandle personoplysninger i strid med databeskyttelsesreglerne.

Hvis man bruger andres IP-beskyttede data, f.eks. tekst, billeder eller lyd, som man har fundet på internettet, kræver det som udgangspunkt en aftale med rettighedshaverne, før man lovligt kan træne sin AI-løsning på materialet.

Det er dog muligt under visse betingelser at foretage såkaldt tekst- og datamining af materiale, som lovligt er gjort tilgængeligt, f.eks. på internettet, og dermed træne AI-løsninger på IP-beskyttet materiale uden rettighedshavernes tilladelse. Det kan du læse mere om her: Mulighed for at træne AI-løsninger på ophavsretligt beskyttet materiale uden rettighedshavernes tilladelse.

Det kan være et meget omfattende arbejde at sikre sig rettighederne til at bruge andres data i en AI-kontekst. Derfor oplever vi, at stadig flere overvejer, om man i stedet kan træne AI-løsninger på egne data. Det er imidlertid vigtigt at være opmærksom på, at der heller ikke er ”fri leg” i forhold til brug af såkaldte egne data. Brug af egne data kræver, at der foretages en kortlægning af, hvem der har ophavsretten til de pågældende data. Det er nemlig ikke givet, at en virksomhed eller myndighed har ophavsretten til egne data, idet ophavsret tilkommer den fysiske person, der har skabt værket (ophaveren). Det betyder, at en medarbejder, der udarbejder materiale som en del af sit arbejde, som udgangspunkt selv er ophaver. Ophavsretsloven indeholder dog en specifik bestemmelse om edb-programmer (software), hvorefter ophavsretten til software, der er frembragt af en medarbejder under udførelsen af dennes arbejde, overgår til arbejdsgiveren.

Ophavsretten til andet end software kan imidlertid helt eller delvist overgå til arbejdsgiver, f.eks. ved aftale eller som led i et ansættelsesforhold. Såfremt ophavsrettens overgang fra medarbejderen til organisationen (arbejdsgiveren) ikke er reguleret i enten en aftale eller i medarbejderens ansættelseskontrakt, får organisationen kun ophavsretten – eller dele deraf – til et værk i det omfang, det var nødvendigt for organisationens sædvanlige virksomhed på tidspunktet, hvor medarbejderen skabte værket. Vurderingen af, hvad der er nødvendigt for organisationens sædvanlige virksomhed, kan ændre sig over tid. Det, der er sædvanligt i 2025, var ikke nødvendigvis sædvanligt, hvis materialet f.eks. blev udarbejdet af en medarbejder i 2005 eller 2015.

Såfremt organisationen (arbejdsgiveren) hverken har ret til at anvende materialet til udvikling af AI i henhold til medarbejderens ansættelseskontrakt, efter anden aftale eller på baggrund af princippet om ophavsrettens overgang i ansættelsesforhold, vil organisationens brug kræve medarbejderens tilladelse.

Materiale kan også være udarbejdet af tredjeparter, f.eks. eksterne konsulenter, eller licenseret. Dokumenter fra tredjeparter kan indeholde materiale, eksempelvis tekster og fotografier, som er beskyttet efter ophavsretsloven. Det vil derfor kræve tilladelse fra de respektive rettighedshavere at bruge det pågældende materiale til udvikling af AI. I praksis vil det formentlig være vanskeligt at indhente de fornødne tilladelser hos de enkelte rettighedshavere grundet omfanget af materiale og mængden af rettighedshavere. Som alternativ til individuel rettighedsklarering er der på nogle områder mulighed for at indgå/tilslutte sig aftaler med de forvaltningsorganisationer, som repræsenterer rettighedshavere til den slags materiale, der indgår i dokumenter fra tredjeparter. Sådanne aftaler vil – i det omfang de har såkaldt aftalelicensvirkning via en godkendelse i Kulturministeriet – også omfatte ikke-repræsenterede rettighedshavere, dvs. rettighedshavere som ikke er medlem af de pågældende organisationer. Der findes imidlertid ikke på nuværende tidspunkt aftaler med aftalelicensvirkning, der dækker brug af data til udvikling og brug af AI.

Hvordan sikrer man, at man lovligt kan bruge egne data i forbindelse med træning og brug af AI?

Første skridt er at kortlægge egne data:

Hvilke data ønsker man at bruge?
Hvem har udarbejdet det pågældende materiale?
Har man de relevante rettigheder hertil?

Har man ikke overblik over data, er det umuligt at foretage en vurdering af, om man har tilstrækkelige rettigheder til at bruge de pågældende data i en AI-kontekst.

Vurderes det, at man ikke har de relevante rettigheder, bør organisationen sikre sig de fornødne tilladelser til at benytte eksisterende og/eller fremtidigt materiale til udviklingen af AI, så AI-projekter kan realiseres.

Det er også helt afgørende, at man får udarbejdet en AI-politik med henblik på at skabe opmærksomhed om lovlig anvendelse af data internt i organisationen. Det er som nævnt ikke kun selve træningen, der forudsætter, at man har de relevante rettigheder – også medarbejderes løbende brug, f.eks. i form af ”prompts”, forudsætter, at organisationen har de relevante ophavs- eller brugsrettigheder.

Når man træner og bruger AI, er det desuden vigtigt at være opmærksom på, at databeskyttelsesreglerne også skal overholdes, hvis data indeholder personoplysninger. Dette indebærer bl.a. sikring af et lovligt behandlingsgrundlag og iagttagelse af de registreredes rettigheder.

Brug for hjælp?

Har du spørgsmål til, hvordan din virksomhed, organisation eller myndighed får udarbejdet en dækkende AI-politik, eller har du brug for hjælp til gennemgang af vilkår og restriktioner i jeres licensaftaler? Vores specialister står klar til at rådgive om alt inden for AI og IP- og data-relaterede udfordringer.

Du kan desuden læse meget mere om ophavsret og den (begrænsede) regulering af rettigheder i den nyligt vedtagne AI-forordning i denne artikel: AI-forordningen: Hvad skal du være opmærksom på? samt om de problemstillinger, man bør have for øje, når der skal udarbejdes interne AI-retningslinjer, i denne artikel: Interne retningslinjer for brug af AI mindsker risikoen for IP-krænkelser.

Specialister

Brug af data til udvikling af AI

Hvordan sikrer man, at man lovligt kan bruge egne data i forbindelse med træning og brug af AI?

Brug for hjælp?

Specialister

Maiken Toftgaard

Mette Lindskoug

Jacob Lau Pedersen

Malene Kaae Nørgaard

Malte Philbert Jessen

Nilas Christian Steensen

Sille Riemann

Tugba Karacan

Hold dig opdateret: Få juridisk viden og indsigter fra vores eksperter direkte i din indbakke