Mostra continua de vides laborals 2010

11 Novembre 2011

Fa gairebé un any ja vaig parlar de la Mostra Continua de Vides Laborals (MCVL) i de la seva aplicabilitat als municipis de més 40.000 habitants en el post Mostra contínua de vides laborals (MCVL): l’ús a nivell local.

En aquell post, com exemple de la utilitat de la MCVL, presentava l’evolució dia a dia, durant el 2009, dels treballadors assalariats en alta laboral que cotitzaven al règim general de la Seguretat Social per als municipis més grans de la província de Barcelona, i també del conjunt de la província de Barcelona. Aquell gràfic permetia veure el comportament estacional per part de les empreses a l’hora de contractar personal i en l’acomiadament o finalitzacions de contractes, com és el cas, per exemple, de l’inici o la finalització del curs escolar, etcètera (gràfic dinàmic).

En aquest post continuaré analitzant dades extretes de la MCVL del 2010 sense dades fiscals per a Mataró, fent tres petits treballs estadístics. El primer treball consisteix en calcular l’error d’aquesta mostra a nivell municipal; el segon, és comprovar si la mostra presenta un bon ajustament en la seva distribució per seccions econòmiques; i la tercera, és comprovar si la xifra d’assalariats del darrer dia del mes és una “bona mesura” del que ha passat durant el mes.

Comencem. En primer lloc abans de calcular l’error mostral, cal explicar que és. Així l’error mostral és la divergència que hi ha entre l’estadístic obtingut a través de la mostra i el corresponent paràmetre de la població. Així, de la MCVL-2010, el nombre de treballadors assalariats mostrejats que cotitzen al règim general en centres de cotització ubicats a Mataró, en data 31 de març del 2010, és de 1.219, xifra que representa el 4,13% del total de cotitzants que dóna el Departament d’Empresa i Ocupació per aquesta mateixa data (29.506 assalariats). Fixant un nivell de confiança del 95,5%, l’error màxim d’aquesta mostra és del 2,81%. Es tracta doncs d’un nivell d’error més que assumible, ja que habitualment s’utilitzen errors del 5% o inferiors. Si voleu calcular l’error, ho podeu fer accedint a aquest full de càlcul fent clic a sobre l’imatge.

El segon treball té com a objectiu comprovar si la distribució dels assalariats que cotitzen al règim general de la Seguretat Social per seccions econòmiques de la MCVL-2010, s’ajusta a la distribució que trimestralment proporciona el Departament d’Empresa i Ocupació (enllaç). Per fer aquesta comprovació utilitzo la prova no paramètrica Chi-quadrat de bondat d’ajust. Aquesta prova l’ aplico als assalariats que treballen a Mataró per als quatre trimestres del 2010. La hipòtesi nul·la d’aquest contrast és la següent: la istribució de la mostra s’ajusta a la de la població (nota: s’han agrupat algunes seccions econòmiques, ja que els valors esperats estaven per sota de 5).

La prova s’ha dut a terme amb el paquet estadístic de software lliure R, i el resultat que s’obté és el següent:

                             p-valor

31 de març             0.9841054

30 de juny              0.9707055

30 de setembre    0.9872099

31 de desembre    0.9434755

Amb aquests p-valors no es pot rebutjar la hipòtesi nul·la que la distribució per seccions econòmiques de la mostra dels assalariats que treballen en centres de cotització ubicats a Mataró s’ajusti a la distribució poblacional per als quatre dies seleccionats.

 La sintaxi d’R per dur a terme el trobareu en el següent fitxer: Sintaxi bondat ajust.

El darrer treball que duré a terme té com objectiu comprovar si la data en què s’ofereix informació sobre el total de cotitzants en alta laboral al règim de la Seguretat Social explica adequadament el volum d’assalariats que hi ha hagut durant el mes. Però que vol dir “explicar adequadament”? En aquest cas he optat per utilitzar la mitjana diària d’assalariats de cada mes, si bé una altra possibilitat seria utilitzar la mediana.

Per tant la hipòtesi nul·la a contrastar diu el següent: la mitjana diària d’assalariats de cada mes és igual a la xifra del darrer dia. Per dur a terme aquest contrasta utilitzo una prova no paramètrica –com en el cas de la prova de bondad d’ajust– donat que la distribució de la dades no s’ajusta a la d’una normal, tal i com s’observa a través dels dotze histogrames corresponents als dotze mesos.

Per tant, la no normalitat en la distribució diària de cada mes dels assalariats, fa que la prova a realitzar per contrastar la hipòtesi nul·la plantejada anteriorment sigui la prova de Wilcoxon, i els resultats d’aquesta prova per cada mes del 2010 a Mataró són els següents:

Només en els mesos de setembre i d’octubre, el p-valor de la prova de Wilcoxon aconsegueix un valor clarament superior al 5%, i per tant no es pot rebutjar la hipòtesi nul·la, que diu que la mitjana d’assalariats del mes és igual a la dada del darrer dia del mes. Si observem l’interval de confiança de la prova de Wilcoxon per als mesos de setembre i octubre, s’observa com la xifra d’assalariats del darrer dia dels mesos respectius, es troben dins de l’interval de confiança.

En la resta de mesos el p-valor es troba per sota del 5%, fet que no permet acceptar la hipòtesi nul·la, i per tant se’n desprèn que la xifra d’assalariats del darrer dia és diferent de la mitjana mensual. Com es pot veure en la taula, en set mesos, la xifra d’assalariats del darrer dia del mes es troba per sobre de la mitjana mensual d’assalariats, mentre que en només tres mesos està per sota de la mitjana. Aquests, són els resultats per a Mataró. Si voleu replicar la prova en el següent enllaç hi trobareu la sintaxi d’R: Sintaxi Wilcoxon.

La MCVL és un mostra pensada per fer investigacions a nivell estatal o autonòmic, i el fet de posar a l’abast una mostra tan gran (per sobre del milió de persones) i amb tantes variables (més de 100 variables) permet fer-hi anàlisis per a col·lectius minoritaris. Però els municipis de més de 40.000 habitants també la podem aprofitar per extreure’n dades del nostre municipi. Val a dir, però, que per als observatoris municipals explotar la ingent quantitat d’informació que hi ha en aquesta base dades no és fàcil ja que d’entrada requereix disposar de maquinari i programari adequat per explotar una base de dades amb més de 14 milions de registres (que corresponen a més d’un milió de persones), però segurament el més important és que es necessari dedicar-hi un temps important per conèixer la base de dades. Crec, sincerament, que val la pena dedicar-hi temps a conèixer i explotar aquesta base de dades, ja que, fins al moment, és l’única eina gratuïta –l’únic cost seria el temps que hi dediqui el tècnic– que permet conèixer més a fons una part important del mercat de treball local.

Gerard Reverté Calvet

Servei d’Estudis i Planficació

Ajuntament de Mataró


Mostra contínua de vides laborals (MCVL): l’ús a nivell local

17 Desembre 2010

 

Font: elaboració del Servei d’Estudis i Planificació de l’Ajuntament de Mataró a partir de les dades de la Mostra Continua de Vides Laborals sense dades fiscals 2009 (MCVL-2009).

Diàriament, a Espanya, hi ha persones que són contractades per empreses, n’hi ha que són acomiadades, a d’altres simplement no se’ls hi renova el contracte, o al contrari, se’ls hi amplia la durada el contracte. També, cada dia, hi ha gent que compleix 65 anys i es jubila: passen de cobrar la nòmina de l’empresa a rebre la pensió de jubilació; o d’altres que es prejubilen. També hi ha persones que mentre no troben feina tenen dret a percebre la prestació per desocupació, i d’altres que perceben el subsidi per desocupació. Totes aquestes persones, i moltes més, tenen un nexe en comú: la Seguretat Social. N’hi ha que contribueixen a la Seguretat Social amb les seves cotitzacions, i altres, que després de contribuir a la Seguretat Social, els hi arribat el moment de ser-ne beneficiaris. En definitiva, ja sigui contribuint-hi o sent-ne beneficiari, la Seguretat Social és un punt de trobada per a diferents col•lectius de persones de l’Estat espanyol.

Tota aquesta ingent quantitat d’informació que la Seguretat Social té dels ciutadans i de les empreses resta emmagatzemada des de fa dècades en servidors informàtics, i òbviament resulta d’una importància capital per tal que la Seguretat Social pugui desenvolupar la seva gestió administrativa adequadament. Però a banda de la seva importància administrativa, també representa una font d’informació molt important per als investigadors. De fet molts investigadors han estat interessats en aquesta informació i al llarg dels anys l’han sol•licitat i han utilitzat aquestes dades per als seus estudis, però extreure aquesta informació requeria un cost i un esforç considerable, i a més per cada estudi se n’extreia únicament la informació rellevant per aquest estudi. Aquests dos factors han ajudat a què finalment la Seguretat Social creés la mostra continua de vides laborals (MCVL). La MCVL és un conjunt organitzat de microdades anonimitzades que s’han extret de registres administratius, tant de la Seguretat Social com del Padró Municipal Continu d’Habitants i, depenent de les versions, de dades fiscals de l’Agència Tributària.

El nombre de persones que apareixen en la MCVL està per sobre del milió, i constitueixen una mostra representativa de totes les persones que van tenir una relació amb la Seguretat Social en l’any de referència de la mostra (el 4% de les persones que formen part de la població de referència). S’anomena continua perquè s’actualitza anualment. I és de vides laborals perquè si bé la població de referència de la mostra és la població cotitzant o pensionista de l’any de referència, la mostra conté tot l’historial anterior de les persones seleccionades per a les variables procedents de la Seguretat Social, remuntant-se cap endarrere fins on es conserven registres informatitzats.

Un dels avantatges que proporciona la MCVL per als municipis, és que permet identificar el municipi de residència de les persones que apareixen en la mostra i també el municipi del centre de cotització, sempre i quan es tracti d’un municipi de més de 40.000 habitants. Així doncs, la MCVL permet tenir una “fotografia” força actualitzada -i també d’un passat més llunyà- de l’estructura del mercat de treball dels municipis grans. Però no només és possible tenir “fotografies” en moments concrets, sinó que també es possible accedir a la “pel•lícula”, ja que com s’ha dit anteriorment en la MCVL es té accés a tot l’historial de relacions amb la Seguretat Social que han tingut les persones que apareixen en la mostra.

Com exemple d’aquesta “pel•lícula” hi ha el gràfic que apareix al principi del post, que fa referència a l’evolució diària de treballadors assalariats que cotitzen al règim general de la Seguretat Social durant al 2009 a Mataró (per veure el gràfic dinàmic dels municipis de més de 50.000 habitants de la província de Barcelona feu clic aquí). El gràfic permet visualitzar situacions puntuals, com per exemple la davallada d’assalariats que es produeix l’1 de maig del 2009 –“Dia internacional dels treballadors” que era divendres-, i com la sèrie remunta el dia 4 de maig –dilluns-. En el gràfic es detecta la finalització del curs escolar, el 23 de juny, i per tant la finalització de contractes de personal de suport dels centres educatius, de monitors de menjador,… També es pot veure clarament com l’agost és el mes de vacances per excel•lència, i l’1 d’agost finalitzen molts contractes i el nivell de treballadors durant el mes d’agost és ostensiblement més baix que en la resta de mesos. La remuntada no es produeix a principis de setembre sinó a mitjans de setembre, més concretament el 14 de setembre, dia d’inici del curs escolar 2009-2010. Una altra situació que mostra el gràfic és el repunt de treballadors assalariats que es produeix en els dies previs a Nadal, possiblement per tal d’afrontar la campanya de compres nadalenca; de fet els valors més baixos d’assalariats del mes de desembre es van registrar entre el divendres 25 de desembre i el diumenge 27 de desembre; en els dies posteriors la sèrie remunta per fer front a la revetlla de cap d’any, però no assoleix, ni molt menys els nivells dels dies previs a Nadal.

En definitiva, el que es vol mostrar en aquest post és que la MCVL és una font d’informació molt valuosa a nivell espanyol i català, però també pot ser-ho per als municipis grans, ja que ajuda a omplir un buit informatiu important del qual no es tenien dades fins al moment a nivell local. No cal oblidar, però, que aquesta font d’informació no dóna sortida a tots els dubtes relacionats amb el mercat de treball sinó a uns quants. Així, per exemple, es continuarà sense saber el nombre de treballadors que hi ha en l’economia submergida o el nombre de desocupats que no estan apuntats a les llistes de l’INEM o de l’OSOC.

Servei d’Estudis i Planificació
Ajuntament de Mataró


Visualització personalitzada de dades

10 Setembre 2010

Ens trobem en l’era d’Internet on en pocs “clics” es poden accedir a un ingent nombre de dades. El desenvolupament d’Internet ha arribat a un nivell en el qual ja no és necessari tenir instal·lat en l’ordinador cap programari d’ofimàtica, ja que a la xarxa hi ha paquets d’ofimàtica que ens permeten treballar la informació.

Un dels més famosos és el Google Docs. A banda de l’avantatge que suposa no haver d’instal·lar cap programari al nostre ordinador, i que només cal disposar de connexió a Internet (preferentment de banda ampla), un altre punt a favor de Google Docs és que disposa d’un important nombre de petites aplicacions anomenades “gadgets” en la seva terminologia en anglès –o “ginys” en català– que milloren la visualització i presentació de la informació, fent-la més dinàmica i amena.

Un exemple de giny és el gràfic de moviment de Google Docs. Basat en Flash, el gràfic de moviment que permet analitzar al llarg del temps diversos indicadors. Un dels avantatges d’aquest ginys és que cadascú pot personalitzar el gràfic ja que pot seleccionar per cada eix l’indicador que li sembli més adequat, i també pot modificar la mida de la bombolla que representa a cada territori en funció de l’indicador que consideri més adient.

Al final d’aquest article hi ha un enllaç a un gràfic dinàmic dels principals municipis de la província de Barcelona. Aquest gràfic permet fer un anàlisi mensual1 des de l’any 2006 de com han evolucionat en cada municipi alguns indicadors relacionats amb el mercat de treball: treballadors assalariats, treballadors autònoms, atur registrat, taxa d’atur registrat, població activa estimada… A més a més, cada municipi és pot classificar en funció de si pertanyen o no al projecte “Perfil de ciutat”, el que dóna possibilitat de veure si els municipis que pertanyen al projecte tenen, o no tenen, una dinàmica -en els indicadors que hi ha en aquesta base de dades- diferent dels que no pertanyen al projecte “Perfil de ciutat”.

1 En alguns municipis i en alguns indicadors la periodicitat és trimestral o anual.

Gràfic dinàmic