Imputeringsmodell för saknad sysselsättningsstatus i arbetslöshetsdata

23 mars 2017

Ofullständig data är ett fundamentalt problem vid utvärderingar av arbetsmarknadspolitiska insatser. I Arbetsförmedlingens register avslutas 20 procent av alla arbetslöshetsperioder av okänd orsak. Detta leder till en osäkerhet om vilken sysselsättningsstatus (sysselsatt eller inte sysselsatt) individen har efter sin registrerade arbetslöshetsperiod.

Enligt fullständiga kombinerade administrativa data är sysselsättningsnivån bland dem som lämnat Arbetsförmedlingen av okänd orsak nära 50 procent mellan 1992 och 2006. Sedan dess har sysselsättningsnivån bland dem som lämnar Arbetsförmedlingen av okänd orsak minskat till 40 procent.

Denna rapport använder en imputeringsansats för att undersöka om en imputeringsmodell kan användas för att komma åt problemet med ofullständig data. Imputeringsmodeller skattas på enkätdata från 2005/2006 och på fullständiga administrativa data från 2005/2006 och 2011/2012. Modellerna utvärderas i termer av deras förmåga att göra korrekta prediktioner. Modellerna har relativt hög prediktiv förmåga.