Teknologi, der kan forstå og gengive talt sprog, er i voldsom vækst, men det danske sprog er for småt et marked til, at private virksomheder alene kan drive udvikling af teknologien. Innovationsfonden har bevilliget 14 mio. kroner til et projekt, der skal bringe dansk taleteknologi op på internationalt niveau.

Det globale marked for taleteknologi vil vokse med 16-19 pct. årligt de næste fem år, viser undersøgelser fra blandt andet Fortune Business Insights. Desværre halter det danske marked i øjeblikket bagud, fordi det er for ressourcekrævende at udvikle dansk taleteknologi for den enkelte virksomhed.

Det er ærgerligt, fordi dansk erhvervsliv går glip af god forretning, og samfundet snydes for innovative løsninger, der fx kan anvendes i hjælpemidler til ældre og borgere med synshandicap eller effektiviseringer i det offentlige. Det skal et nyt forsknings- og innovationssamarbejde mellem Alvenir, Corti, Digitaliseringsstyrelsen, Københavns Universitet og Alexandra Instituttet nu rette op på.

Taleteknologi skal gøres tilgængelig for alle

Projektet skal udvikle et taledatasæt med navnet Danish Conversational and read-aloud speech dataset (CoRal). Datasættet vil indeholde 1000-1500 timers samtale og oplæst tale fra et bredt og repræsentativt udsnit af befolkningen i forhold til køn, alder, danske dialekter og udenlandske accenter. Samtidig skal der udvikles sprogmodeller, der kan genkende dansk tale og læse dansk tekst højt.

I øjeblikket har dansk taleteknologi nemlig svært ved at forstå kvinder, ældre, dialekter og accenter. Og for at taleteknologi kan bruges i for eksempel voicebots og stemmestyrede hjælpemidler, er det nødvendigt, at det virker for alle borgere. Det er således ikke kun et økonomisk potentiale, der skal indfris; det er også et demokratisk deficit, der skal indhentes.

Open source gavner virksomheder og samfundet

”Taleteknologi kan skabe enorm værdi, både for dansk erhvervsliv og for vores samfund som helhed,” spår Jens Kaas Benner, Head of AI and Data Analytics Lab på Alexandra Instituttet.

”Når vi gør danske datasæt og sprogmodeller gratis tilgængelige, bliver det pludselig let for virksomhederne at komme i gang med at udvikle og bruge løsninger, der ’forstår’ talesprog. Og det offentlige kan blive aflastet, når for eksempel dokumentation og sundhedsjournaler kan automatiseres,” siger han.

Alle data og modeller bliver testet og offentliggjort løbende, så udviklere, virksomheder og offentlige institutioner kan drage nytte af dem fra start. Alexandra Instituttet står sammen med Digitaliseringsstyrelsen i første omgang for rekrutteringen af talere fra hele landet og opfordrer især kvinder, ældre og borgere, der taler med accent eller dialekt til at melde sig. Bred rekruttering af talere er nemlig en forudsætning for projektets succes.

Kontakt

Projektleder Kasper Fænø Bay Noer, Senior Digital Strategist på Alexandra Instituttet

Tlf. 26 83 80 44 kasper.noer@alexandra.dk.

Du kan læse mere om projektet i den fulde pressemeddelelse her

Foto: Alexandra Instituttet