En feil i utregningen av skalapoengene som måler elevers ferdighetsnivå i lesing, regning og engelsk i nasjonale prøver gjennomført i årene 2014–2021 ble avdekket i en artikkel publisert av Markussen et al., (2024). Metoden som ble benyttet til å måle utvikling i elevenes ferdighetsnivå over tid ble ikke implementert på riktig måte, og ga dermed et upresist bilde av endringer i ferdighetsnivå over tid. I 2024 estimerte Utdanningsdirektoratet (Udir) skalapoengene på nytt, for alle nasjonale prøver på 5. og 8. trinn i perioden 2014–2021, ut ifra en bedre egnet metodikk.

SSB publiserer den offisielle statistikken for nasjonale prøver, og kobler disse resultatene til ulike variabler som innvandrerkategori og foreldrenes utdanningsnivå. Udirs nye resultater kan dessverre ikke kobles direkte til SSB sin gamle data, da Udir ikke har beholdt personidentifiserende informasjon.

Hovedformålet med dette metodenotatet er å vurdere ulike metoder SSB kan bruke til å korrigere den offisielle statistikken, og eventuelt andre statistikker som benytter seg av resultater fra nasjonale prøver – slik at de reflekterer de nye estimatene fra Udir. Vi presenterer tre alternativer til hvordan man kan reestimere skalapoengene: lokal omskalering, global omskalering og en regresjonstilnærming.

Vi vurderer «goodness of fit» til de ulike metodene og undersøker hvordan valg av modell påvirker resultater på utvalg av ulike størrelse. Dette er viktig da SSB publiserer statistikk aggregert på ulike gruppenivå, og ikke for enkeltindivider. Et slikt eksempel kan være resultater fra nasjonale prøver i norske fylker. Det er da nøyaktigheten av resultatene på slike gruppenivå som burde anses som aller viktigst, hvor nøyaktigheten på individnivå er av mindre viktighet.

Generelt sett presterer alle metodene nokså likt når man aggregerer på gruppenivå, og forskjellene i «goodness of fit» er relativt små. Vi anbefaler derfor at man benytter seg av den globale omskaleringsmetoden, som er lettest å anvende, har færrest antagelser, og som ikke tilføyer ny støy i dataene.