Privacybeskyttelse kan blive en god forretning

Nyt europæisk teknologisamarbejde, som Alexandra Instituttet deltager i, skal gøre det lettere at dele og håndtere data uden at indhente samtykke.

Efter at GDPR trådte i kraft i foråret 2018, er der rigtig mange virksomheder, der bruger krudt på at håndtere samtykke og lave databehandleraftaler, når de deler data på tværs af organisationer. Men en nyt europæisk teknologisamarbejde, som Alexandra Instituttet deltager i, kan potentielt gøre det lettere at dele data uden at skulle indhente samtykke.

Det svarer til at dele anonymiseret data, og dermed falder det juridisk ikke ind under GDPR. Dermed kan man undgå nogle af de ting, der er besværlige i dag.

Sådan lyder det fra Mads Schaarup Andersen og Jonas Lindstrøm, begge fra Security Lab på Alexandra Instituttet. De arbejder begge på SODA (Scalable Oblivios Data Analytics), der er et europæisk teknologisamarbejde, der skal gøre det nemmere at foretage analyser på personfølsomme data.

“Vi har altid kunnet tilbyde den service, hvor man kan lave analyser på kombinerede data. Men den tidligere salgscase på teknologien har typisk været sygehuse eller organisationer, der ligger inde med personfølsomme data, som de gerne vil dele. Det er stadig relevant. Men GPDR har gjort teknologien endnu mere relevant, fordi lovgivningen kræver noget, den ikke har gjort før. Og så begynder virksomhederne at kigge efter tekniske løsninger på, hvordan de får løst det her. Så på den måde har lovgivningen skabt en businesscase på noget, som vi har arbejdet med i mange år,” forklarer Jonas Lindstrøm.

Maskinlæring træner hr-data

En case er Collektive, der leverer infrastrukturen til modeller, der arbejder med hr-data om ansatte. Modellerne kan fx bruges til at forudsige sygefravær og stress, og så kan virksomheder tage deres forholdsregler ud fra det.

Problemet er, at virksomheder typisk kun har data om deres egne ansatte. Det bedste i verden ville være, hvis de havde adgang til hr-data fra alle virksomheder i verden. Men det er selvfølgelig ikke muligt, da det er personfølsomme data.

Derfor bruger Collektive maskinlæring på en model, der bliver fodret med data, og som dermed gradvis bliver bedre, i takt med at den bliver trænet. Men i stedet for at hver eneste virksomhed skal træne modellen ud fra deres egne data, så henter Collektive modellerne hjem og kombinerer dem og prøver dermed at lave en model, der er bedre end den enkelte.

“Pointen er, at Collektive ikke får noget data at se. De leverer bare infrastrukturen. Men virksomhederne får en model, der er bedre trænet, og som er mere brugbar til at forudsige sygefravær og stress,” forklarer Mads Schaarup Andersen.

Kan demokratisere kommunale data

Teknologien kan også være oplagt for mange af de kommuner, som vil etablere smart city-platforme eller dele offentlige data.

Nogle af de organisationer i Danmark, der ligger inde med rigtig meget interessant data, er de offentlige myndigheder. De ligger nærmest inde med data om alt, hvad vi går og foretager os, og de har typisk meget bedre data end det, Google og Facebook opererer på. De har bare ikke haft mulighed for rigtig at udnytte det, hvilket den nye teknologi kan være med til at ændre på.

Læs mere her