En ny hensigtserklæring mellem Dansk Sprogmodel Konsortium (DSK) og Danske Pressepublikationers Kollektive Forvaltningsorganisation (DPCMO) baner vej for udviklingen af danske sprogmodeller, der respekterer dataejeres rettigheder. Aftalen muliggør frikøb af data fra danske medier og sikrer et ansvarligt fundament for træning af kunstig intelligens.
De fleste af nutidens AI-modeller er trænet på data uden hensyntagen til copyright og dataejeres rettigheder. Den nye danske hensigtserklæring er den første af sin slags i Europa og skal bane vejen for sprogmodeller, der tager højde for ophavsret.
En ansvarlig dansk tilgang
Ifølge digitaliseringsminister Caroline Stage Olsen bidrager erklæringen geopolitisk til at sikre Danmarks suverænitet som stat.
“Jeg er meget tilfreds med den nye hensigtserklæring. Den understreger, at vi i Danmark arbejder med kunstig intelligens og sprogmodeller på den danske måde, hvor vi går ansvarligt til værks og med en frikøbsmodel sikrer gode betingelser for dataejerne. Indhold er ikke gratis, heller ikke når det handler om at udvikle nye teknologier. Lad os vise resten af verden, at det godt kan lade sig gøre at udvikle ny teknologi, hvor dataejerne får en ret og rimelig behandling,” siger hun.
Hos Alexandra Instituttet, som er medstifter af Dansk Sprogmodel Konsortium, ser man aftalen som en milepæl for AI-udviklingen i Danmark.
“Selvom erklæringen ikke betyder, at data allerede er blevet frikøbt, så giver aftalen mulighed for at frikøbe data fra danske medier til Dansk Sprogmodel Konsortium. Aftalen er således en vigtig milepæl i udviklingen af danske sprogmodeller, som er baseret på data med respekt for dataejers betingelser. Det skaber et stærkt fundament for ansvarlig brug af data i AI-udviklingen,” forklarer CEO, Niels Husted Kjær.
Han peger samtidig på, at Danmark med denne aftale går forrest i Europa:
“Med dette historiske skridt er Danmark det første land i Europa, der forsøger at etablere en sådan aftale. Det er afgørende, fordi det adresserer et væsentligt problem, nemlig at de fleste AI-modeller i dag trænes på data uden hensyntagen til rettigheder. Denne aftale sætter fokus på nødvendigheden af at respektere dataejernes ophavsret,” siger han.
Jens Kaas Benner, der er Head of AI Lab hos Alexandra Instituttet ser også aftalen som en løsning på en central udfordring i udviklingen af danske sprogmodeller:
“Muligheden for frikøb af data fra de danske medier er en afgørende faktor for, hvor hurtigt vi kan udvikle uafhængige, åbne, danske sprogmodeller. Vi har de kompetencer, der kræves for udvikling, og med Gefion-computeren har vi også den nødvendige beregningskraft i landet. I øjeblikket er det adgang til data, der sætter begrænsningen. En del af det problem kan løses med denne aftale,” Fortæller Jens Kaas Benner.
Foto: Unsplash