Bruddberegninger av AKU-omleggingen

Publisert:

Ved beregning av bruddanslag for arbeidsledighet og sysselsetting som følge av AKU-omleggingen i 2021, har vi benyttet en tidsseriemodell. Modellen sammenligner utviklingen i AKU med utviklingen i registervariable.

Metoden for bruddberegningen vil gi bedre anslag på bruddene etter hvert som man får AKU-tall for flere måneder etter bruddet. Bruddanslagene vil derfor bli oppdatert i løpet av 2021.

Fra januar 2021 er det benyttet et nytt skjema for arbeidskraftundersøkelsen (AKU). I tillegg endres blant annet utvalgsplan, målpopulasjon og estimeringsmetode. Se artikkelen Ny AKU gir brudd i tidsseriene.

Forhold som kan gi brudd

Spørresekvenser, spørsmålsformuleringer og svaralternativer endres som følge av modernisering av språket, økt samordning internasjonalt samt tilpasset selvutfylling som fremtidig innsamlingsmetode. Flere variabler endres i tråd med endringer i arbeidsmarkedet. Det gjelder blant annet endringer i hvordan arbeidstid telles og at det stilles flere spørsmål om fravær og varigheten på fraværet i det nye spørreskjemaet.

Fra 2021 får ufrivillig helt permitterte i mer enn 90 dager de vanlige spørsmålene om arbeidssøking og tilgjengelighet i AKU, og kan dermed bli klassifisert som utenfor arbeidsstyrken. Tidligere derimot, ble helt permitterte i mer enn 90 dager automatisk regnet som arbeidsledige i AKU uten å få spørsmål om aktiv arbeidssøking eller tilgjengelighet. Denne endringen i skjema og filter kombinert med at det norske arbeidsmarkedet samtidig er i en situasjon med mange ufrivillig permitterte vil isolert sett bidra til noe færre arbeidsledige.

Målpopulasjonen endres fra å omfatte alle registrerte bosatte 15-74 år til alle registrerte bosatte 15-89 år i private husholdninger. Dette medfører at flere aldersgrupper inngår, mens for eksempel personer i førstegangstjenesten utgår da de ikke kan regnes som bosatt i private husholdninger. Tidligere kunne personer i samme familie svare for andre i familien. Når trekkeenheten endres til person, tillates ikke lenger andre husholdningsmedlemmer å svare på vegne av personen.

Utvalgsplanen endres gradvis fra familieutvalg til personutvalg stratifisert etter personkjennetegn. Endret allokering av utvalget vil gradvis over en toårsperiode kunne gi endringer i feilmarginen for ulike variable og aldersgrupper.

I denne artikkelen omtales kun metode for å beregne evt. brudd knyttet til omleggingen av AKU i 2021 for personer 15-74 år.

Ulike måter å beregne effekter av evt. brudd samlet sett

Ved omlegging av en statistikk kan man i en periode utarbeide statistikken ved både gammel og ny metode. Effekten av omleggingen kan da anslås som forskjellen mellom statistikken utarbeidet med ny og gammel metode. Resultatet kan benyttes til å justere statistikken utarbeidet ved gammel metode slik at denne er sammenlignbar med statistikken utarbeidet med ny metode.

For AKU vil en parallell datainnsamling etter både gammel og ny metode innebære at man måtte intervjue dobbelt så mange personer. Siden AKU er en utvalgsundersøkelse med stor usikkerhet, ville det sannsynligvis vært nødvendig å gjennomføre dobbelt sett med intervjuer i en lengre periode for å få et godt anslag på effekten av omleggingen av undersøkelsen. Siden alle intervjuene i AKU gjennomføres av egne intervjuere (over telefon), ville en slik dobbel datainnsamling bli svært kostbar. I tillegg skal SSB sørge for lav oppgavebyrde samlet sett, noe som innebærer at man i utgangspunktet ikke skal intervjue flere personer enn det som strengt tatt er nødvendig i produksjonen av for eksempel AKU.

I 4. kvartal 2020 ble det likevel gjennomført en liten ekstraundersøkelse basert på nytt skjema og ny utvalgsenhet i AKU. Hovedformålet med dette ekstrautvalget var å sikre at intervjuerne fikk tilstrekkelig intervjutrening med et nytt intervjuskjema forut for omleggingen. Samtidig kunne svarene fra denne ekstraundersøkelsen benyttes til å sammenligne med svar fra tilsvarende gruppe i den ordinære AKU-undersøkelsen. Sammenligningen av resultatene fra de to utvalgene kan gi en indikasjon på om omleggingen i AKU har ført til et brudd i tallseriene for arbeidsledighet og sysselsetting. SSB har tidligere rapportert at sammenligningen mellom det ordinære AKU-utvalget og dette ekstrautvalget kunne tyde på AKU-omleggingen vil innebære en oppjustering av sysselsettingen. Ekstrautvalget er meget lite og bruddanslagene man får ved en slik sammenligning blir svært usikre.

En alternativ måte å anslå størrelsen på et eventuelt brudd er å sammenligne en AKU-tidsserie over bruddtidspunktet med en annen tidsserie, for samme tidsrom, som historisk har samvariert mye med AKU-serien og som ikke antas å ha noe brudd samtidig med AKU-serien. For eksempel kan man sammenligne utviklingen i arbeidsledigheten målt i AKU med antall arbeidsledige registrert hos NAV. Dersom det for eksempel, ifølge AKU, er en økning i arbeidsledigheten fra desember 2020 (gammelt spørreskjema) til januar 2021 (nytt spørreskjema) samtidig som det ikke er noen endring i antall arbeidsledige registrert hos NAV i denne perioden, kan man anslå at hele endringen i AKU skyldes omleggingen. Jo sterkere samvariasjonen mellom arbeidsledigheten målt med AKU og NAV har vært historisk, jo mer presist blir anslaget på bruddet.

Definisjonen av arbeidsledighet er forskjellig for tallene fra AKU og NAV. Permitterte regnes som arbeidsledige hos NAV, mens de i AKU regnes som sysselsatt midlertidig fraværene (og dermed ikke arbeidsledig) i de første 90 dagene av permitteringen. For å kunne sammenligne arbeidsledighetstallene må man korrigere for denne forskjellen. Måletidspunktet for tallene fra AKU og NAV er også ulike. Mens AKU-tallene representerer et gjennomsnitt for hele måneden, måler tallene fra NAV arbeidsledigheten i slutten av måneden. I perioder med stor utvikling i arbeidsledigheten gjennom måneden, vil de ulike måletidspunktene gi ulik utvikling i arbeidsledigheten. Derfor er det også nødvendig å korrigere for ulikt måletidspunkt. I Konjunkturtendensene fra september 2020, boks 2.1, illustreres hvordan man kan korrigere for korttidspermitterte og måletidspunkt for å få mer sammenlignbare tidsserier for arbeidsledighet.

Beregning av brudd samlet sett

Ved beregning av bruddanslag for arbeidsledighet og sysselsetting i AKU som følge av AKU-omleggingen i 2021, har vi benyttet en tidsseriemodell. I tidsseriemodellen benytter vi resultatene fra ekstrautvalget i 4. kvartal 2020, i tillegg til at vi sammenligner utviklingen i AKU-variablene med utviklingen i relevante registervariable. Tidsseriemodellen tar også hensyn til at personene som svarer i AKU-undersøkelsen intervjues hver tredje måned over to år. Utvalget i AKU i en måned er dermed i stor grad sammenfallende med utvalget tre måneder tidligere. Det viser seg at hvis arbeidsledigheten målt i AKU i en måned er større enn det man anslår basert på sammenhengen mellom AKU-ledighet og NAV-ledighet (korrigert for ulike definisjoner, måletidspunkt og ulik sesongutvikling), vil man også tre måneder senere forvente av AKU-ledigheten er større enn den direkte sammenhengen med NAV-ledigheten skulle tilsi. Tidsseriemodellen vi benytter i denne bruddanalysen tar hensyn til dette.

Tidsseriemodellen for sysselsetting i AKU utnytter registerinformasjon om antall lønnstakere fra A-ordningen for å forbedre bruddanslag i AKU-sysselsettingen.

Usikre og foreløpige anslag på samlet brudd – revisjon må påregnes

Om en hadde hatt en tilstrekkelig stor parallell datafangst med nytt spørreskjema året i forkant, ville en kunne hatt mer presise bruddestimater fra første publisering av tall fra ny AKU som ikke var foreløpige. Siden det ikke var mulig, har vi valgt å benytte oss av tidsseriemodellering. Ulempen er at denne metoden vil gi upresise bruddestimater de første månedene etter bruddet og at det dermed blir revisjoner av bruddestimatene etter hvert som flere observasjoner blir tilgjengelige.

I og med at vi i tidsseriemodellen kan innarbeide informasjon fra det parallelle utvalget i 4. kvartal 2020, vil revisjonene av bruddanslagene kunne bli noe mindre og litt raskere nærme seg endelige bruddanslag enn uten parallell datafangst.

Koronakrisen gir ekstra usikre anslag på samlet brudd

Covid 19-pandemien har ført til større svingninger i AKU-ledighet og AKU-sysselsetting. Det bidrar isolert sett til større usikkerhet i anslaget for samlet brudd i disse størrelsene. Usikkerheten reduseres imidlertid av at registervariablene vi har med i tidsseriemodellen i stor grad beveger seg i takt med AKU-variablene. Samlet sett innebærer likevel pandemien at bruddene blir mer usikre (enn om overgangen til ny AKU hadde skjedd i en periode uten store svingninger i arbeidsmarkedet).

Bruddjusterte registertall som hjelpevariabler i tidsseriemodellen

Registertallene vi benytter i tidsseriemodellene er i forkant justert for ulike brudd.

Registerlønnstakere er prekorrigert hovedsakelig for brudd knyttet til overgangen fra Arbeidstakerregisteret til A-ordningen i 2015.

Permitteringsharmoniserte registrerte ledige er for alle grupper prekorrigert for to endringer hos NAV: a) påminnelse på SMS fra juli 2018 til arbeidsledige om å sende meldekort modellert som ett nivåskift b) ny registreringsløsning i november 2018 for alle som registrerer seg som arbeidssøkere som får arbeidssøkere raskere inn i statistikken over registrerte arbeidssøkere, modellert som ett gradvis (kvadratisk avtagende) brudd fra og med november 2018 til januar 2019.

Permitteringsharmoniserte registrerte ledige er registrerte helt ledige ved arbeidskontorene (NAV) der ufrivillige helt permitterte mindre enn 90 dager er holdt utenfor fra og med mars 2020. På grunn av COVID-19-pandemien var det ekstremt høyt tall permitteringer som hos NAV regnes som registrerte arbeidsledige fra første dag (av registrering), mens AKU behandler dem som sysselsatte midlertidig fraværende de første 90 dagene og deretter som arbeidsledige. Vår ekskludering av ufrivillige helt permitterte mindre enn 90 dager gjøres for å harmonisere registervariabelen for å få en mer stabil og høy samvariasjon med antall arbeidsledige fra AKU. I etterkant av brudd-/prekorrigering tar vi også 2-måneders gjennomsnitt av registervariabelen, dvs. gjennomsnitt av beholdning rundt utgangen av måneden og måneden før. 2-måneders gjennomsnitt er viktig for forbedret samvariasjon med antall arbeidsledige fra AKU som er målt som gjennomsnitt for måneden. Dette er særlig en viktig i oppstarten i Korona-perioden i Norge siste del av mars, og når effektene på arbeidsmarkedet er ikke ulike innad i en måned.

Bølgejusterte månedstall

Tidsseriemodellering tar utgangspunkt i bølgejusterte og fordelte månedstall fra AKU. Intervjuobjektene skal være med hver tredje måned over en to-årsperiode, etter planen i alt 8 ganger. Første bølge er betegnelsen på de som er med for første gang, andre bølge andre gang, osv.

Estimeringsmetoden for norsk AKU er kalibrering av månedlige AKU-data. Estimeringsprosedyren er ikke kalibrering pr. bølge. Til tidsseriemodellen bruker vi derfor justeringsfaktorer som vi multipliserer de vanlige månedsvektene med for at bølgefordelte månedlige tall skal være i samsvar med populasjonstallene. Konsistensen er sikret for gruppene kjønn kryssklassifisert av 3 aldersgrupper (15-24, 25-54 og 55-74 år). Ved å modellere bølgefordelte månedstall kan vi også ta hensyn til endringer over tid i feilmarginen for ulike variabler i ulike aldersgrupper forårsaket av enten endret allokering av utvalget som nå gradvis fases inn eller mer generelt endret frafall i AKU over tid.

Estimeringen i AKU skjer nå i flere steg, og kalles multippel modell-kalibrering (MMK), Oguz-Alper (2018). Metoden er litt justert i forbindelse med omleggingen i 2021. Innledningsvis modelleres hovedarbeidsmarkedsstatus i AKU, som er sysselsatt, arbeidsledig, utenfor arbeidsstyrken, konsistent med en multinomisk logit-modell (forklart nedenfor) forklart med en rekke registervariable kjent for alle i populasjonen. Modellen gir predikerte sannsynligheter for de ulike hovedarbeidsmarkedsstatusene for enhver i populasjonen. Utgangsvektene i AKU kalibreres ved hjelp av de predikerte sannsynlighetene og flere registervariable direkte. Dette gjør at vektene også blir konsistente med populasjonen for antall i bl.a. befolkningsregisteret etter kjønn, aldersgrupper, landsdel og antall registerlønnstakene.

En multinomisk logit-modell er en logistisk regresjon generalisert til mer enn to mulige diskrete resultater. Modellen brukes til å forutsi sannsynlighetene for de forskjellige mulige utfallene av en kategorisk distribuert avhengig variabel, gitt et sett med uavhengige variabler.

Utgangsvektene, før kalibreringen, er forholdet mellom antall personer i populasjonen og bruttoutvalget i ulike strata benyttet i trekkingen av utvalget. Utgangsvektene tar høyde for at inndelingen i strata og allokeringen av utvalget har endret seg over tid. Tidligere var utvalget stratifisert etter fylke, mens det fra og med 1. kvartal 2021 gradvis over en 2-årsperiode fases inn utvalg stratifisert etter landsdel og flere personkjennetegn på en mer effektiv måte.

Faktaside