I et EU-forskningsprojekt skal Alexandra Instituttet udvikle en germansk sprogmodel, der skal mindske afhængigheden af engelsksprogede sprogmodeller som ChatGPT, da disse i høj grad er drevet af kommercielle interesser i USA, og dermed ikke lever op til europæiske standarder.

Kunstig intelligens bliver stadig større

På ganske få år har engelsksprogede sprogmodeller som ChatGPT og Bard vokset sig store. De store systemer har dog en slagside, som EU og andre ikke bryder sig om. De er underlagt anden regulering og kultur, hvilket betyder, at europæerne bliver tvunget ind i systemer, der ikke lever op til europæiske værdisæt for ‘human-centered, trustworthy og democratised’ kunstig intelligens.

“Kunstig intelligens er et tog, der kører, og det kommer til at påvirke mindst 80% af arbejdsstyrken. Får vi ikke tilgodeset vores sprog, løber de andre med alle mulighederne. Vi må sikre vores sprog og yderligere opbygge vores kompetencer for at sikre egne interesser”, siger Torben Blach, der er Alexandra Instituttets projektleder på det nye ambitiøse forskningsprojekt TrustLLM.

Alexandra Instituttets eksperter ´vil gennem projektet samarbejde med de absolut stærkeste europæiske forskere inden for sprogteknologi. Som GTS-institut er det en rolle, som instituttet tager meget seriøst. Erfaringerne skal nemlig bidrage til det nationale arbejde, der ligger foran os for med tiden at lave en dansk sprogmodel.

“Vi er nu med i den gruppe af vigtige aktører, der er gået sammen om at udvikle modellerne til de germanske sprog. Med samarbejdet opbygger vi vores kompetencer yderligere og får et førstehåndsindtryk af de data, der indsamles, og som modellerne skal trænes på”, siger Torben Blach.

Sammen med Alexandra Instituttet indgår 10 andre vidensinstitutioner på tværs af EU inklusiv Københavns Universitet.

En open source-tankegang

Projektet kommer også til at kigge på både den etiske, den forskningstunge og den forretningsmæssige side af AI. Alexandra Instituttets Senior AI Specialist og ph.d. Dan Saattrup Nielsen understreger, at vi i dag ser en række begrænsninger med de modeller, der er udviklet. Derfor er den primære motivation at bruge open source-tankegangen.

“Vi er afhængige af andres data og modellens struktur, som samtidig er lukket, så vi ikke kender logikken. Derfor skal vi gøre modellerne bedre og fikse de ting, som vi har set, at eksempelvis ChatGPT er skidt til. Det kan være bias, som vi gennem vores forskning skal minimere i træning af modellen. Vi skal også minimere antal gange, modellerne hallucinerer og finder på facts ud af det blå”, siger Dan Saattrup Nielsen.

TrustLLM-projektet løber frem til oktober 2026, hvor formålet er at udvikle en åben, troværdig og bæredygtig sprogmodel.

Læs mere om projektet og Alexandra Instituttets deltagelse her

Foto: Unsplash