Viatge a Ítaca…amb R i la MCVL

15 gener 2016

Quan surts per fer el viatge cap a Ítaca,

has de pregar que el camí sigui llarg,

ple d’aventures, ple de coneixences.

Així comença el famós poema de Kavafis, amb la traducció de Carles Riba, que glosa el viatge de tornada d’Ulisses a casa seva, Ítaca. Reconec que és agosarat utilitzar aquest preciós poema per parlar d’R i de la Mostra Contínua de Vides Laborals (MCVL), però crec que és un bon símil per explicar l’experiència de Laura Gómez García amb R i amb la MCVL.

Certament no és el primer cop, ni serà l’últim, que parlem des de l’Ajuntament de Mataró de la Mostra Contínua de Vides Laborals (vegeu aquí, aquí, aquí i aquí), però si que és el primer cop que Laura Gómez García, treballadora de l’Ajuntament de Mataró com Pla d’Ocupació, utilitza el software estadístic lliure R (i més concretament la seva IDE R-Studio) i s’endinsa dins de la maresma que implica utilitzar la Mostra Contínua de Vides Laborals (MCVL).

En el viatge de tornada d’Ulisses, hi ha tres aspectes rellevants: el destí (Ítaca), el mitja de transport (el vaixell), i el lloc per on transcorre el viatge (la mar Mediterrània). Continuant amb el símil, en el treball que ha fet Laura el destí serien els objectius que se li van encarregar, el mitjà de transport seria el software utilitzat per fer el treball, i el lloc per on transcorre el viatge seria la MCVL. Llegeix la resta d’aquesta entrada »


Riquesa i desigualtat

8 Juny 2012

Certament la mostra continua de vides laborals suposa una font d’informació molt important per als investigadors, centres de recerca i universitats, però també ho és per als municipis, tal i com ja he explicitat en més d’un post. Novament, i a risc de fer-me pesat, torno a insistir en l’aprofitament d’aquesta font d’informació per als municipis, tractant en aquest cas la mostra que conté les dades fiscals.

Només com a recordatori, la MCVL està disponible anualment des del 2004, i cada any es publiquen dues onades: la primera està disponible cap al mes de maig/juny, i conté l’historial laboral de les persones mostrejades; la segona, està disponible cap al mes d’octubre, i conté, a banda de l’historial laboral, les dades fiscals. Les dades fiscals, però, no procedeixen de la declaració de renda, sinó que s’extreuen del model 190 de la Agencia Tributaria Española. Segurament la primera pregunta que us vindrà al cap a molts de vosaltres serà… i què és el model 190? És el resum anual de retencions i ingressos a compte de l’IRPF sobre els rendiments del treball, de determinades activitats econòmiques, premis i determinades imputacions de renda.

Es tracta d’un model de declaració informatiu en el que no hi ha cap supòsit d’exempció en l’obligació de declarar. Així, totes les entitats que paguen salaris, pensions o prestacions per desocupació estan obligades a presentar el model, amb independència de la seva personalitat jurídica, la seva activitat, la dimensió o el caràcter públic o privat de les mateixes, per tant la informació de la que es disposa és exhaustiva i detallada. Cada retenidor o pagador de rendes presenta una informació resum i una relació de perceptors amb informació individualitzada de les dades per construir retribucions satisfetes i retencions practicades. Conformen la base les poblacions d’assalariats, pensionistes i perceptors de prestacions de desocupació que resideixen en el territori de règim fiscal comú, que inclou tot el territori de l’Estat espanyol excepte el País Basc i Navarra. En aquestes relacions de perceptors hi consten totes les persones que reben rendes subjectes a l’IRPF encara que es tracti de retribucions inferiors al mínim legal d’exempció per l’obligació de declarar l’IRPF, retribucions amb tipus de retenció nul o rendes exemptes.

En aquest petit treball que presento en aquest post he utilitzat la MCVL amb dades fiscals del 2010. Del conjunt de tota la mostra he obtingut la submostra corresponent als municipis de més de 40.000 habitants de Catalunya. Un primer anàlisi gràfic a través de boxplot, permet veure com Sant Cugat és el municipi que presenta, amb diferència, uns ingressos dels individus mostrejats més elevats, però també presenta una “caixa” més allargada, simptomàtic d’una distribució més dispersa de les dades que la resta de municipis. També s’observa com a Sant Cugat la mediana no està centrada en la caixa, indicatiu d’una distribució asimètrica positiva. Això també és pot veure en el fet que la mitjana d’ingressos de Sant Cugat és clarament més grans que la mediana. Aquesta darrera característica té lloc en els 25 municipis, però és a Sant Cugat on aquestes diferències són més notòries.

Nota: no es presenten els valors “outliers” dels boxplots.
Font: elaboració pròpia a partir de les dades Mostra Contínua de Vides Laborals amb dades fiscals 2010.

L’asimetria en la distribució dels ingressos és indicatiu de la desigualtat dels ingressos, i un dels indicadors més utilitzats per calcular la desigualtat és l’índex de Gini, que gràficament és representa a través de la corba de Lorenz.

Font: elaboració pròpia a partir de les dades Mostra Contínua de Vides Laborals amb dades fiscals 2010.

En comparar la corba de Lorenz de cada municipi amb la del conjunt dels 25 municipis de la província de Barcelona, s’observa com Sant Cugat és el que presenta una desigualtat més important respecte el conjunt de tots els municipis.

Font: elaboració pròpia a partir de les dades Mostra Contínua de Vides Laborals amb dades fiscals 2010.

En la següent taula es presenten els resultats per als 25 municipis de diferents indicadors de desigualtat com són el de Gini, el d’Atkinson, el de l’entropia, el coeficient de variació i el quadrat del coeficient de variació, calculats a partir de la MCVL amb dades fiscals del 2010. A més a més dels indicadors de desigualtat se li ha afegit la mitjana dels ingressos anuals –també extrets de la MCVL– i les dades de la renda familiar disponible bruta per càpita del 2008 que estan disponibles al web de l’Idescat.

Taula indicadors desigualtat

Font: elaboració pròpia a partir de les dades Mostra Contínua de Vides Laborals amb dades fiscals 2010 i de dades procedents de l’Idescat.

 

 

Fent un gràfic de dispersió dos a dos dels diferents indicadors se n’obté el següent panell de gràfics.

Font: elaboració pròpia a partir de les dades Mostra Contínua de Vides Laborals amb dades fiscals 2010 i de dades procedents de l’Idescat.

I la matriu de correlacions és la següent:

Font: elaboració pròpia a partir de les dades Mostra Contínua de Vides Laborals amb dades fiscals 2010 i de dades procedents de l’Idescat.

Del panell de gràfics i de la matriu de correlacions se’n pot extreure una primera conclusió òbvia: hi ha una correlació positiva entre els nou indicadors de desigualtat que s’han calculat; una segona conclusió és que s’observa una correlació positiva entre ingressos i els diferents indicadors de desigualtat. La mateixa correlació positiva s’observa amb la RFDBpc i els indicadors de desigualtat. És a dir, els municipis amb més ingressos són els que presenten més desigualtat. Cal tenir present, però, que es tracta únicament d’una relació lineal i no d’una relació de causalitat, ja que fer una anàlisi de causalitat necessita d’un estudi molt més profund de la realitat social del nostre entorn. L’objectiu d’aquest petit treball consisteix en fer una primera explotació descriptiva a nivell municipal, de les dades fiscals que hi ha disponibles en la MCVL.

Gerard Reverté Calvet

Servei d’Estudis i Planificació

Ajuntament de Mataró


%d bloggers like this: