Maskinlæring vejer værdien i elevdata

Kan maskinlæring berige den eksisterende viden om elevfrafald på ungdomsuddannelserne og dermed skabe bedre beslutningsgrundlag?

Det har Horsens Kommune i samarbejde med Alexandra Instituttet undersøgt i et pilotprojekt, hvor man har kigget på samkøring af data på tværs af kommunen. I projektet har man undersøgt om maskinlæring kan være med til at give mere indsigt i data og dermed muliggøre bedre forudsigelser for den enkelte elev.

Analysen har tydeliggjort det, man allerede vidste i forvejen. Nemlig, at der er sammenhæng mellem en række faktorer i screening af elever. Analysen viser dog også klart, at det stiller krav til datakvaliteten. Det er vigtigt, at man registrerer data på ensartet vis, så det egner sig til at indgå i en større sammenhæng; ellers er det meget vanskeligt at få nogen indsigt – med eller uden maskinlæring.

Konkret kiggede man på, om der er sammenhæng mellem en række faktorer, herunder fravær, uddannelsesniveau samt forældrenes selvforsørgelse. Baggrunden er, at det på landsplan, og også i Horsens Kommune, er et mål, at 95 procent af en årgang skal have en videregående uddannelse. Inge Kruse Rasmussen, økonomidirektør i Horsens Kommune, fortæller:

“Når vi arbejder med data i dag, så udvælger vi typisk nogle data, hvor vi tror, at der er en sammenhæng. I dette pilotprojekt ville vi se, om man kunne lave nogle forecast ved hjælp af kunstig intelligens og maskinlæring. Vi havde ikke en forventning om, at vi fandt den endelige nøgle til ungdomsuddannelses-frafaldet. Vi gik ind i pilotprojektet, fordi vi for en overskuelig investering kunne finde ud af, hvad vi kan lære af det, hvis der mangler noget.”

Ingen nye mønstre

Valget faldt på skoledata, karakterer, fravær på skoleområdet samt data fra familieområdet. I forsøget har man opnået resultater omkring dataindsigt og processen. Overordnet har projektet kvalificeret, hvad man allerede vidste om elevfrafald.

Det er blevet tydeliggjort, at der er sammenhænge mellem faktorer i screening af elever såsom: Karaktergennemsnit, fravær, forældrenes selvforsørgelsesgrad, geografi, herkomst, underretning af børnesager.

Altså, at jo mere fravær i skolen, des mere påvirker det, om man får en uddannelse. Jo dårligere karakterer en elev har, des større er chancen for, at de ikke får en uddannelse.

“Men vi finder ikke et mønster, der gør, at vi bliver skarpere på det, og hvor vi kan finde det bedre end før. Vi finder ikke et mønster, hvor vi kan sige, at når lille Peter optræder på en bestemt måde i systemet, så får han ingen uddannelse. Vi finder altså ikke noget, som vi ikke har tænkt i forvejen,” forklarer hun.

Frugtbar dialog om data

Den væsentligste årsag er, at datagrundlaget ikke er tilstrækkeligt robust. Enten var dataene ikke altid lige velegnede, eller også var tidsserierne ikke altid lange nok. Alligevel har forsøget båret frugt, da det har været en god måde at undersøge, om man har de nødvendige data til rådighed, inden man begynder at brænde større summer af.

Læs mere her