Notater 2020/21

Metodikk for modernisering av statistikkproduksjonen

Dette notatet presenterer en bearbeidet versjon av metodikken som er utarbeidet i forbindelse med modernisering av statistikkproduksjonen.

Det første som ble utarbeidet i arbeidet med å modernisere statistikkproduksjonen er hvilke prinsipper en moderne produksjon bør vektlegge. Disse prinsippene gjelder temaer som faglig forankring, metadata, dokumentasjon, arkivering, automatisering, dataeditering, kvalitet, evaluering og effektive metoder.

Det grunnleggende for å bygge en statistikkproduksjon er å ha tilgang til funksjoner. Nødvendige funksjoner har blitt identifisert og kategorisert her/i dette notatet. Funksjoner må være tilgjengelig for statistikkproduksjonen ved at de enten finnes i et programmeringsspråk man har tilgang til, kan bygges av statistikk¬produsenten selv eller kan tas i bruk via bruk av «internasjonale biblioteker», slik som for eksempel Cran for de som bruker programmeringsspråket R.

Deretter har vi sett på hvordan funksjoner kan settes sammen til en prosess. De fleste prosesser har minst tre prosessteg - forprosess, hovedprosess og etterprosess. Forprosessen er ofte en tilrettelegging av data for hovedprosessen, mens etterprosessen er en kontroll av at hovedprosessen har gjort det den skal med tilfredsstillende kvalitet.

Data går bearbeides gjennom hele produksjonsprosessen. En datatilstand er et datasett med metadata på et gitt punkt i produksjonsprosessen. Hovedtilstandene er de viktigste datatilstander i produksjonsprosessen: rådata, inndata, klargjorte data, statistikkdata og utdata. Vi har laget en oversikt over hvilke delprosesser som inngår i utarbeidelsen av hver hovedtilstand og hvilke kvalitetskriterier hver av hovedtilstandene har.

Deretter har vi laget forslag til hvilke kvalitetsmål som kan beregnes for å kunne måle om kvalitetskravene til hovedtilstandene er oppfylt. Kvalitetsmålene er kategorisert etter tema: Metadata, populasjon-enhet og variabler. Vi har i tillegg sett på hva som skal til for å tilrettelegge et statistikksystem for å kunne lage kvalitetsmålene. Det viktigste er å ta vare på informasjon som genereres underveis, fra de ulike prosessene, slik at de i etterkant kan brukes til å beregne kvalitetsmål.

Til slutt presenterer vi en prosessmodell som legger vekt på automatisering, makroperspektiv, kvalitet og datatilstander. Modellen et sett av prosesser satt i rekkefølge, der den menneskelige interaksjonen med dataene er skilt klart ut fra det som kan bli gjort maskinelt. I denne modellen har vi integrert kvalitet i alle prosesser og produkter som inngår. Dette er en metode for å sikre god kvalitet på sluttproduktene.

Om publikasjonen

Tittel

Metodikk for modernisering av statistikkproduksjonen

Ansvarlig

Remy Bråthen, Ane Seierstad og Aslaug Hurlen Foss

Serie og -nummer

Notater 2020/21

Utgiver

Statistisk sentralbyrå

Emner

Metoder og dokumentasjon, Metoder og dokumentasjon

ISBN (elektronisk)

978-82-587-1129-9

ISSN

2535-7271

Antall sider

37

Om Notater

I serien Notater publiseres dokumentasjon, metodebeskrivelser, modellbeskrivelser og standarder.

Kontakt