Estimem molt la taxa d’atur

28 octubre 2013

Obtenir la taxa d’atur que sigui aplicable a escala local, actualitzable amb freqüència, comparable interterritorialment i que sigui un mètode barat, exclou les metodologies que inclouen una enquesta. Calcular-la a escala local és una quimera sobre la que s’ha anat fent progressos i aproximacions a partir de fonts d’informació registrals.

Ens queden els registres administratius on es puguin recollir variables assimilables a la població aturada i la població ocupada.

1 EPA

Aquest post és un breu exercici de comparació de dos mètodes, aplicats com a exemple a una comarca i un municipi. També s’apliquen a Catalunya per a poder posar-ho en relació als resultats de l’EPA. A partir d’aquest exercici és pot concloure que:

- Els nivells d’atur són força diferents entre funció de la metodologia utilitzada: EPA, Taxes d’Activitat i Afiliació.

- Les fluctuacions són més altes en el cas de l’EPA (l’atur es copsa mitjançant enquesta).

- La posició relativa de cada territori es manté comparant els mètodes aplicats a escala local: les taxes fluctuen de forma semblant.

- La taxa d’atur del municipi estaria aproximadament un punt percentual per sobre la de Catalunya, i unes dècimes de punt per sota la taxa de la comarca.

La tendència d’evolució ha estat similar en els tres territoris, mantenint-se les diferències entre els mateixos. S’ha produït augment de l’atur de juny de 2012 a març de 2013 i disminució de març a juny en 2013. Això darrer ja havia succeït de març a juny de 2012. No s’inclouen les taxes de setembre 2013 atès que pel càlcul d’una d’elles calen dades d’afiliació, no publicades a dia d’avui.

En definitiva una opció seria, a l’hora d’estimar la taxa d’atur local, tenir en compte el diferencial (calculat amb un mètode consensuat) d’aquest àmbit territorial respecte Catalunya. Aleshores si el càlcul de la taxa d’atur més reconegut i estès és el que proporciona l’Enquesta de Població Activa (EPA), a nivell local es podria aplicar el diferencial estimat respecte la taxa catalana que mostra l’EPA.

Llegeix la resta d’aquesta entrada »


Entenent les dades del mercat de treball

6 setembre 2013

Les dades d’atur registrat del mes d’agost aparegudes aquesta setmana conviden, segons el Govern espanyol i segons alguns mitjans de comunicació, a l’optimisme. Per contra, els partits de l’oposició i diversos mitjans de comunicació creuen que les dades d’atur registrat, tot i no ser dolentes, si es combinen amb la pèrdua d’aproximadament 99.000 afiliats en alta laboral a la Seguretat Social, deixa la situació del mercat de treball espanyol tal i com estava, és a dir, a la UVI; en aquest sentit vaig llegir un comentari que va aparèixer en El País en referència a l’article “Evolución del mercado de trabajo” que deia, entre altres coses, el següent: “¿Cómo se come eso de que disminuya el paro y simultáneamente perdamos cientos de miles de afiliados a la SS.? …

Tot plegat m’ha fet reflexionar sobre la dificultat d’entendre les xifres del “mercat de treball”. L’objectiu –segurament agosarat– que m’he marcat en aquest post és intentar explicar de la forma més senzilla possible com “funcionen” els fluxos dels registres del mercat de treball espanyol.

Per explicar els fluxos presento el següent gràfic. El primer que vull apuntar és que aquest gràfic és una simplificació del sistema del mercat de treball, i que en cap cas la mida dels rectangles que apareixen en el gràfic representen el volum de població que hi ha en cada variable, ja que únicament s’intenta representar quines variables estan contingudes en altres variables.

Sistema simplificat del mercat de treball

Llegeix la resta d’aquesta entrada »


El Cadastre com a font periòdica de dades urbanes (II)

28 juny 2013

En l’anterior post és va explicar quina informació conté l’arxiu 11 que es pot descarregar del Cadastre. A continuació s’explicarà la informació que conté la resta d’arxius que es poden descarregar del Cadastre: els arxius 13, 14, 15, 16 i 17.

• L’arxiu 13 conté els registres d’unitats constructives per cada parcel·la cadastral. En línies generals el concepte d’unitat constructiva coincideix amb el d’edifici, tot i que es poden admetre configuracions diferents a l’haver-hi en el mateix edifici diferents unitats constructives si aquest s’ha realitzat en diferents fases de construcció, o si presenta estats de conservació o zones de valors-trams de ponència diferents. A més, cada unitat constructiva potser urbana o rústica, segons la naturalesa del sòl ocupat (i l’any de la ponència). Llegeix la resta d’aquesta entrada »


El Cadastre com a font periòdica de dades urbanes (I)

26 juny 2013

Presentació

En la “I Jornada de Govern Obert de Terrassa” que va tenir lloc el proppassat dia 20 de juny, en el torn de preguntes de la “Taula de debat sobre Open Data: realment s’estan obrint les dades per a ser reutilitzades?” es va comentar que el Cadastre espanyol és un dels millors del món en quant a l’obertura de dades que ofereix, afirmació amb la qual hi van estar d’acord els quatre components de la taula de debat; de la mateixa manera també és va posar el Registre Mercantil com exemple de que no és obertura de dades.

Durant els següents dos posts –el que es publica avui i el que sortirà divendres vinent– el Sr. Antoni Peiret de l’empresa Cylstat, ens donarà una visió general de les possibilitats que ens ofereix l’accés a les dades cadastrals, tant alfanumèriques com cartogràfiques, que es poden obtenir des del Web del Cadastre Virtual.

La possibilitat de disposar d’una informació que s’actualitza els mesos de febrer, juny i octubre, sobre dades relatives a finques, unitats constructives, construccions, immobles, elements comuns o conreus, és d’un gran interès per analitzar l’estructura de les nostres ciutats i els seus entorns periurbans. Més encara si es tracta de dades que es poden creuar amb altres variables. La gran varietat de dades i la seva complexitat, ha fet que s’hagi hagut de publicar en dos posts, per tal de poder donar una mínima visió que inciti a endinsar-nos en aquesta urb de dades que ofereix el Cadastre. Llegeix la resta d’aquesta entrada »


Els notaris digitalitzen les seves dades

14 setembre 2012

Des de fa poques setmanes comptem amb una nova font estadística provinent de la informació de la que disposen els notaris de l’Estat espanyol. La informació que apareix en la seva base estadística és molt àmplia i extensa, i obre un gran ventall de possibilitats i dades que poden ajudar a entendre i anticipar comportaments de les persones, abastant, de moment, des de gener de 2007 fins el mes de març de 2012. I és que, tal i com informen a la seva Web, es tracta de la posada en disposició de la societat de prop d’un milió de series estadístiques, procedents d’escriptures públiques i altres documents notarials. Gràcies a aquesta informació, a partir d’ara podem tractar dades fiables del que les persones paguen pels seus habitatges (hipoteques), el preu de taxació de les mateixes, així com informació sobre donacions, testaments, o dissolucions de societats conjugals.

Tot i la gran feina realitzada, per tal d’informatitzar i obrir aquest ingent volum d’informació, s’ha d’apuntar en la part del “Debe” la falta de desagregació en molts dels grups i sèries estadístiques, que es queden en un nivell autonòmic o provincial, sense arribar al terme local. I és que, malgrat que sí que hi ha sèries on la desagregació arriba fins el municipi, no hi surten tots i només apareixen alguns municipis. Per als municipis que integren el Perfil de la Ciutat, en el cas de les compra-vendes d’habitatges, per exemple, hem trobat dades per als municipis de Girona, Lleida, Mataró, Sabadell, Santa Coloma i Terrassa, i, en canvi, no apareix informació per a la resta de municipis del Perfil, entre els que hi ha alguns amb un volum poblacional elevat (Manresa, Rubí, Vilanova i la Geltrú o Granollers, que superen els 60 mil habitants). Considerem que aquesta informació, així com tota la restant, és susceptible de ser tractada a nivell local ja que en totes les actes notarials figura la localitat en la que s’està procedint a realitzar la signatura del document, i que per tant és un aspecte clarament a millorar.

Però com la nostra manera de fer i sentir és optimista, ens aturarem a analitzar i veure les grans possibilitats que des de ja ofereix el Centro de Información Estadística del Notariado. La base de dades es distribueix a través de 20 grans grups d’informació, que a l’hora aglutinen al voltant de 300 subgrups de sèries estadístiques. La informació, com s’apuntava a l’inici, tracta aspectes com actes d’ordre familiar i personal, contractes per raó de matrimoni i actes relatius a unions o separacions de dret, contractes d’arrendament i cessions d’ús, actes urbanístics o crèdits, préstecs i garanties hipotecàries per citar alguns exemples.

Per posar un exemple de la importància de disposar de dades a nivell municipal, agafem les sèries de compra-venda d’habitatge i de la quantia monetària de les hipoteques consignades amb les entitats bancàries. En el primer dels casos, podem obtenir la informació a nivell local (tot i que no apareixen tots els municipis) i d’aquesta forma observar l’evolució d’aquest indicador. En canvi, per al cas de la quantia de les hipoteques només disposem de la informació a nivell provincial, fet que ens impossibilita comprovar la incidència directa en cada ciutat del preu sobre el número de les transaccions.

Taula 1

Taula 2

Tal i com està presentada la informació, podem arribar a intuir, sense poder fer un anàlisi complet al tractar-se d’àmbits territorials diferents, que el preu no és el factor més determinant perquè es venguin habitatges en els municipis que apareixen en la Taula 1, i que són els aspectes de finançament, mercat laboral o perspectives econòmiques els que afecten més al sector immobiliari, ja que tal i com es veu, una baixada dels preus efectius (a nivell provincial) de venda no afavoreixen el número final de transaccions (a nivell municipal).

És per aquest motiu pel qual des d’aquest humil canal, a més de felicitar al col·lectiu de notaris, volem animar-los a seguir amb aquesta bona feina i aprofundir en la desagregació de les dades, per tal d’ajudar a analitzar la realitat de la societat amb objectivitat i precisió.

Observatori Socioeconòmic de Grameimpuls, SA – Ajuntament de Santa Coloma de Gramenet


Padrons municipals i microestadística (III): el cadastre, primera part

9 setembre 2012

Aquest article es una continuació dels altres dos anteriors, a aquest mateix bloc, sobre la microestadistica de base municipal basada en registres administratius. El primer situava un xic el context actual i les (enormes) possibilitats de fer microestadística als municipis a partir de les bases de dades de padrons fiscals, urbanístics i poblacionals. Al segon fèiem un repàs de les possibilitats tècniques insospitades que dona el padró més conegut de tots, per ser usat i difòs per l’estadística oficial, el padró continu d’habitants.

Tot i ser conscients de que les bases de dades registres administratius a vegades poden ser gigo (‘garbage in garbage out’) — com brillantment explicava el company de l’Observatori de Manresa en aquest mateix bloc–, aquí farem una introducció a una que sembla prou fiable per a extreure’n microestadística fiable. Ja se sap que els resgitres administratius mes fiables són els que tenen motivació fiscal, i els bens immobles (l’objecte del mòn real que registra el cadastre) són la base de molts impostos centrals a l’estructura de qualsevol estat modern i de la propietat privada. No sols de l’IBI, impost local motiu inicial per al que es va crear el cadastre, si no també per a altres impostos estatals com l’IRPF, l’Impost de Societats, l’Impost de Transmissions, etc.

La referència cadastral, el ID que identifica de forma unívoca cada parcel·la de propietat (polígon de sòl de la mateixa proietat i drets reals) i cada construcció en ella enclavada (bens literalment immòbils, que és d’on be la etimologia de be immoble) és,  junt amb el DNI, l’ID de les persones físiques, les claus relacionals (identificadors digitals) que estructuren (relacionen) totes les dades (en sentit de registre informàtic) de les persones, propietats i drets  de les que disposen les administracions. Són la nineta dels ulls del Big Brother del s.XX. Al s.XXI hem d’afegir una tercera ID per al mòn digital: el binomi adreça de e-mail/IP.

Aquì sola volem fer avinent les possibilitats estadístiques i d’extracció de coneixement sobre la ciutat (de fet sobre tot el terme municipal, tant el rural com el urbà) que té el cadastre, una base de dades complexa i integrada amb dos components d’informació codificats i, per tant, tractables matemàticament: la part gràfica (informació gràfica vectorial i georeferenciada) i la part alfanumèrica. I completament homogeneitzada a nivell de l’Estat, per a tots els municipis, grans o petits.

Les possibilitats analítiques de la part gràfica ja l’hem apuntat en un altre article anterior sobre el SIG aplicat. Precisament les capes gràfiques de bens immobles del cadastre son una de les bases cartogràfiques, juntament amb les bases topogràfiques dels instituts cartogràfics oficials, sobre la que s’estructura tota la informació gràfica georeferenciada dels ajuntaments.

Ara volem apuntar aquí la riquesa de les dades que emmagatzema la part alfanumèrica associada a cada referència cadastral. Moltes més de les que podem suposar des de fora. ¿quines realitats socials,  econòmiques i territorials podem estudiar a partir de la base de dades del cadastre estrictament?. A tall d’exemple:

  • estructura i evolució de la propietat
  • estructura i evolució de la urbanització del terreny
  • evolució de la urbanització del terreny i de la forma de edificar-hi al llarg dels anys
  • estructura i evolució dels usos dels terrenys rurals
  • evolució i estructura dels usos econòmics de les edificacions: residencials, industrials, comercials, equipaments públics…
  • evolució i estructura del mercat immobiliari (els canvis de propietat també acaben reflexant-se al cadastre)

Evolució?. Efectivament, el cadastre, de forma similar a com deiem en el cas del padró continu d’habitants,  emmagatzema l’històric fiscal i de propietat del be immoble: any de construcció, any d’adquisició dels drets de propietat sobre el be (per compravenda, successió o altres formes de transmissió de drets reals), historic de rebuts del padró de l’IBI d’aquell be/propietari, etc..

Aquí convé aclarir que el cadastre és molt més que el Padró de l’IBI, que no és més que els rebuts generats a partir de la situació cadastral de propietat del be immoble a 1 de gener de cada any. Així doncs, la base de dades de l’IBI NO es la base de dades del cadastre, sino un subconjunt de la informació de la segona per a generar una obligació fiscal determinada. En la definició de l’arxiu informàtic d’intercanvi entre entitats locals i les Direccions Provincials del Catastro es pot tenir una idea mes acurada de les dades que conté l’IBI.

Això vol dir que molta informació analíticament interessant potser sols està als sistemes informàtics de la Direccion General del Catastro, als que es pot tenir accès privilegiat, des dels municipis, gràcies als magnífics serveis de la Oficina Virtual del Catastro.

De fet, la DG del Catastro obra molt la informació de les seves bases de dades no sols a les entitats amb les que intercanvia dades, les entidades col·laboradoras (ajuntaments, notaris i registradors de la propietat), si no a tots els ciutadans, tant per a consultes puntuals d’un be immoble com per a consultes massives de centenars o milers de bens immobles.

Be, per anar obrint una mica l’interès per les dades cadastrals per avui ja n’hi ha prou. En una segona part d’aquest article (i IV de la sèrie de padrons i microestadistica) entrarem una mica mes al detall de les dades concretes: camps (variables), codis (categories) i estadístiques publicades que hi ha al cadastre. I en exemples d’explotacions analítiques concretes, quelcom que tot just fa un lustre que s’ha començat a fer i potenciar.

Precisament, just ara ens trobem en procès de documentació i revisió bibliogràfica sobre la base de dades del cadastre i de tots els complexes conceptes (legals la majoria) que representen les seves dades….

I s’ha de començar pel principi dels principis: la Ley del Catastro!

Per cert, el cadastre ens parla de totxos i cases, de impostos o de drets de propietat?. Doncs més del segon que del primer, segur!. I un sociòleg, com un servidor, es fa creus de com a través de l’explotació adhoc i a fons del cadastre –si ens deixen entrar als seus sistemes informàtics, clar–, es podria rastrejar la transformació del model de societat a partir del repartiment de la propietat. La propietat és l’eix a partir del que es vertebren les societats capitalistes, les desigualtats, el poder, etc… I de fet de le societats no capitalistes tambe!. I la propietat està registrada i documentada des del temps dels romans. Pero ara està registrada en potentíssimes bases de dades fàcilment interrogables.  ;)

De fet, aquest és una línia de recerca (no iniciada fins on un servidor coneix) que proposem a la comunitat acadèmica investigadora i a la Direccion General del Catastro. I em quedo tant ample…

;)

Josep Vives (Observatori de la Ciutat, Ajuntament de Rubí)


Opendata: obrir les dades de les empreses de serveis públics també (III)

6 abril 2012

Com responsables de generar estadística dels ajuntaments respectius podríem dir que els observatoris municipals tenim fam de dades, que bona part de la feina nostra és estructurar, difondre i fins i tot interpretar totes les dades que existeixen, dispersades aquí i allà,  sobre els nostres municipis. Dades procedents de diferents entitats, produides per diferents organismes.

Quina és la font primària de les dades dels  municipis que treballem des dels observatoris?. Habitualment, en el 95% dels casos o més, son producte del buidat de registres informàtics producte de registres administratius, la majoria lligats a les funcions fiscals i recaptatòries, o de control,  de les diferents administracions: registres de la seguretat social, llicències d’activitat, de circulació, de construcció d’habitatges etc… A qualsevol registre administratiu hi ha el domicili del fet imposable i, per tant, és una dada territorialitzable a nivell municipal i fins i tot geoposicionable amb exactitud mil·limètrica sobre el territori.

Encara hi ha molta feina per fer alhora de treure profit tant dels registres administratius propis dels ajuntaments com, sobretot, dels registres dels diferents ministeris i conselleries. Els observatoris municipals anem avançant força en aquest sentit a base de contactar amb els diferents serveis de documentació o planificació de les administracions superiors que produeixen cadascuna de les dades.  Que ens facilitin les respectives dades municipalitzades acaba depenent de l’obertura del responsable polític de les dades o de l’esperit col·laboratiu dels responsables tècnics d’aquestes.

Però hi ha una altra font de dades encara pràcticament inexplotada per la dificultat d’accedir-hi: les dades de les companyies de serveis públics en règim de concessió. Operadores de telecomunicacions, companyies elèctriques,  de gas, d’aigua, autopistes, companyies de transport públic, etc. Companyies que abans eren empreses públiques, monopolis públics, però que es van privatitzar i ¿liberalitzar? durant les dos darreres dècades.  I que tenen a les seves bases de dades un coneixement preciòs per l’interès públic. El consum energètic, la mobilitat i el consum d’ample de banda a les diferents barris i zones de les nostres ciutats son unes dades valuosíssimes per al planejament urbanístic, econòmic i social de les nostres ciutats. Per posar un exemple: com es pot fer politiques sostenibilistes sense conèixer al detall els consums energètics de les diferents zones de la ciutat?. Com planificar la mobilitat si sols tenim dades de mobilitat de transports públics anuals i fragmentades per operadors o concessionaris diferents?.

La majoria d’aquestes companyies, bona part d’elles potents multinacionals, com a grans empreses que gestionen milions de clients i desenes de milions de facturació, tenen potentíssims datawarehouses sobre els que apliquen tècniques de mineria de dades per a fer previsions de consum, detectar fraus, o per fer scorings dels clients (cada client rep una puntuació de la capacitat de consum, o del perill de que sigui un moros, o d’altres variables rellevants per al model de negoci i la relació amb el client). És a dir, tenen una capacitat per a extreture dades de forma estructurada, i analitzar-les, practicament ilimitada. Pel que fa als nostres interesos, aquests sistemes informàtics poden extreure amb suma facilitat dades agregades a nivell territorial amb el màxim de granularitat territorial que es necessiti: dades per província, per municipi, per secció censal, per illa cadastral i, si es vol, per edifici, habitatge, persona… No hem d’oblidar que tenen sistemes SIG integrats indispensables per al seu negoci, i que en aquests traballen sobre la cartografia oficial, com la cartografia catastral.

S’imaginen aquesta potencia analítica al servei de les ciutats, de la planificació de la ciutat?. Jo si que m’ho imagino, i per això no comprenc encara com, en el procés de liberalització de serveis públics essencials no s’ha obligat (reglamentat) a les companyies a compartir les dades de interès públic a alts nivells de granularitat i desagregació (illa cadastral, per exemple). Si més no, amb les administracions públiques!. Que siguin enpreses de titularitat privada no és motiu suficient, al meu parer, pel tancament de dades originades en l’exercici de les seves funcions públiques. El fet és més incomprensible encara des del moment que són uns sectors amb preus i serveis regulats i, per tant, de planificació pública en darrer terme. Com es pot planificar i regular be sense dades detallades?

Generalment, son els organismes reguladors com la Comision del Mercado de las Telecomuniaciones o la Comision Nacional de la Energia,  els que publiquen dades agregades a nivell estatal o, com molt, autonòmic, a partir de la seva funció principal de vetllat per la competència al sector i assegurar els serveis públics obligatoris per llei. Dades que els faciliten les companyies i que es publiquen a nivells d’agregació territorial altíssims: l’estat sencer.

Anem a veure amb una mica més de detall el panoràma de dades municipals en un parell de sectors que em treballat recentment al nostre ajuntament, per tal d’exemplificar, en casos concrets, la problemàtica del tancament d’aquestes fons de dades.

Cas 1. Les dades del sistema energètic.

Actualment, a l’ajuntament de Rubí, s’està desenvolupant un ambiciós projecte de promoció de l’estalvi i l’eficiència energètica de caràcter integral, amb la voluntat de incidir tant sobre el consum del propi ajuntament com sobre el consum de la industria, el comerç i el sector residencial del municipi: www.rubi.cat/energia. En el marc d’aquest projecte portem ja cert recorregut de recerca de dades de consums energètics al nostre municipi i a les diverses zones d’aquest, amb resultats desiguals.

El que hem aconseguit…

Les companyies energètiques no publiquen res!. A nivell de consum energètic als municipis sols  hem trobat les dades elaborades per l’ICAEN a partir de les dades que li subministren les diferents companyies: consum anual d’energia elèctrica i gas natural canalitzat al municipi, i per sectors (residencial, comerç, industrial).  Son dades sempre agregades a nivell de tot el municipi, i publicades amb 3 anys de retard. Ara mateix sols tenim les dades fins el 2008.  Dades que l’ICAEN no publica pero que si ens han facilitat. Resulta curiós que estiguin publicades a nivell municipal les dades de generació d’energia (un fenomen intranscendent dins el sector energètic actualment), però no les de consum energètic, molt més importants i transcendents des de tots els punts de vista. Quedi clar, en tot, cas, que l’ICAEN aquí fa una feina impagable i voluntària, i que supleix la feina de producció d’estadística energètica exhaustiva que entenem haurien de fer altres organismes competents, com el Ministerio de Energia o la Comisión Nacional de la Energia.

El que es podria aconseguir?

Sembla que els procediments de intercanvi de dades entre les administracions i les companyies són poc eficients, almenys quan pots trobar online  dades agregades de consum elèctric en tems real, a nivell de tot Espanya. A la llum d’aquest magnífic gràfic (la font de dades mes objectiva sobre el seguiment de les vagues generals!) no és temerari assegurar que això mateix es podria fer perfectament a nivell d’altres agregats territorials, inclòs el nivell de municipi o, perquè no, d’estació o subestació transformadora. O d’edifici!.

Però mes que el temps real, als municipis els interessaria saber, segurament, el territori real: el consum, i les necessitats energètiques, dels seus barris, urbanitzacions, polígons industrials o, fins i tot, de illa cadastral. I la seva evolució en el temps. També podem assegurar –ja ens desmentireu als comentaris al post, si ens equivoquem– que això és perfectament possible tècnicament donat que totes les factures de consum estan associades a un be immoble amb una referència cadastral.

Una datacooperació  és possible. I convenient.

Les administracions i les empreses de serveis públics hauriem de ser capaces doncs de poder compartir microdades o, si mes no, dades altament desagregades, en benefici mutu i, per tant, en benefici del ciutadà, en el nostre cas, i del client, en el seu. Sempre respectant la protecció de dades personals i el secret estadístic, obviament.

Les administracions, incloses les petites com els ajuntaments, també tenim dades que a aquestes els poden interessar per a planificar millor les seves infrastructures, com és la dinàmica poblacional del padró continu d’habitants, la previsió d’habitatges, la radicació de noves activitats, etc.. Pero sols els municipis mes grans tenen sistemes de datawarehouses i, sobretot, capacitats tècniques per explotar-los, que facin això viable a la pràctica. :(

D’aquesta manera no hauríem de recórrer a complicats models estadístics, fets per grups de recerca universitaris, per a saber els consums energètic dels edificis de la nostra ciutat, com han fet molt recentment a Nova York:

Estimació estadística del consum energètic dels edificis de Nova York

Perquè hem d’estimar dades que en realitat ja existeixen? No és socialment més eficient treballar per poder accedir-hi? Perquè aquesta mania a tancar les dades als nostres sistemes i no compartir-les quan poden ser útils pel be general, per a millorar la governança de la societat i la qualitat de vida?.  Be, la resposta és evident, no siguem il·lusos: la informació és poder.  Però hem d’anar treballant, a roda del moviment de l’opendata, per a que això canviï. I no sols per les dades públiques!

Cas 2. Les dades del sistema de telecomunicacions.

Aquí la manca de dades és encara més greu. No es que no sapiguem els clients o els consums (de telefonia o de ample de banda en aquest cas) al nostre municipi sinó que no sabem ni les infraestructures instal·lades al nostre municipi.Per llogar-hi cadires!. Les teleoperadores no comparteixen on tenen posada la fibra òptica o quina infraestructura tenen instal·lada a les centraletes telefòniques, que són unes informacions rellevants per saber si el nostre municipi podrà entrar de ple a la societat de la informació o es quedarà a la societat dels rumors. On hi ha fibra òptica instal·lada és un secret d’Estat al que, curiosament, no hi té accés l’Estat.

Els ajuntaments sols tenim coneixement indirecte de les infraestructures de telecomunicacions que hi ha a la ciutat, fruit de les llicències que les teleoperadores necessiten per obrir el carrer. Però això sols en el cas de canalitzacions noves. I una cosa és saber que hi ha una canalització de  tal empresa i l’altra saber que hi passa per din i on connecta.

No disposem de informació ni del nombre d’abonats, ni del nombre de línies de banda ampla ni, tant sols, de fins quin punt disposem de infraestructures de fibra òptica. El que si sabem, positivament, es de les enormes carències en ample de banda fruit de les queixes dels clients, ajuntament inclòs.

Òbviament totes aquestes dades les teleoperadores les tenen, i sols han de donar-li a un parell de botons dels seus aplicatius informàtics de consulta sobre el datawarehouse corporatiu per a generar-les sobre un mapa, perfectament geoposicionades. Però simplement no hi ha voluntat de compartir-les.

Cas 3. Les dades del sistema financer.

Sembla evident que per a planificar els serveis socials i les polítiques de promoció econòmica tenir les dades de l’activitat financera al nostre municipi seria un input important ¿no?.  També hem intentat assabentar-nos de l’activitat credíticia al nostre municipi, contactant directament amb les entitats financeres per a saber els crèdits concedits a les empreses del municipi i la seva evolució. La resposta oficial es “no tenim aquesta dada”.  Ejem,..

Addenda.

Com creiem haver demostrat, les dades “sempre existeixen”, i son fàcilment municipalitzables. Tècnicament és ben fàcil fer les consultes als repositoris de dades, públics i privats, per a generar estadística per municipi i fins i tot per àrees més petites, inframunicipals. Si això no es fa, a la pràctica és, en primer lloc, per desconeixement d’aquestes possibilitats dels qui poden decidir sobre aquestes dades. I en segon lloc, per manca de voluntat del propietari de les dades de compartir-les i obrir-les.

En el cas tractat aquí, les dades de les empreses privades de concessió pública, s’adduirà que es un secret de negoci, informació confidencial a preservar als ulls de la competència. Però els reguladors haurien de saber que la desitjada (i no aconseguida) competència sols és possible si el mercat és transparent. Si no ho saben no hauríen de ser reguladors. I, més enllà d’aquesta ensenyança de primer curs a qualsevol facultat d’econòmiques, l’interès públic (la planificació ordenada del territori, dels servies..) hauria de prevaldre sobre l’interès privat (el benefici).

Josep Vives, Observatori de la Ciutat de l’Ajuntament de Rubí


Mostra continua de vides laborals 2010

11 novembre 2011

Fa gairebé un any ja vaig parlar de la Mostra Continua de Vides Laborals (MCVL) i de la seva aplicabilitat als municipis de més 40.000 habitants en el post Mostra contínua de vides laborals (MCVL): l’ús a nivell local.

En aquell post, com exemple de la utilitat de la MCVL, presentava l’evolució dia a dia, durant el 2009, dels treballadors assalariats en alta laboral que cotitzaven al règim general de la Seguretat Social per als municipis més grans de la província de Barcelona, i també del conjunt de la província de Barcelona. Aquell gràfic permetia veure el comportament estacional per part de les empreses a l’hora de contractar personal i en l’acomiadament o finalitzacions de contractes, com és el cas, per exemple, de l’inici o la finalització del curs escolar, etcètera (gràfic dinàmic).

En aquest post continuaré analitzant dades extretes de la MCVL del 2010 sense dades fiscals per a Mataró, fent tres petits treballs estadístics. El primer treball consisteix en calcular l’error d’aquesta mostra a nivell municipal; el segon, és comprovar si la mostra presenta un bon ajustament en la seva distribució per seccions econòmiques; i la tercera, és comprovar si la xifra d’assalariats del darrer dia del mes és una “bona mesura” del que ha passat durant el mes.

Comencem. En primer lloc abans de calcular l’error mostral, cal explicar que és. Així l’error mostral és la divergència que hi ha entre l’estadístic obtingut a través de la mostra i el corresponent paràmetre de la població. Així, de la MCVL-2010, el nombre de treballadors assalariats mostrejats que cotitzen al règim general en centres de cotització ubicats a Mataró, en data 31 de març del 2010, és de 1.219, xifra que representa el 4,13% del total de cotitzants que dóna el Departament d’Empresa i Ocupació per aquesta mateixa data (29.506 assalariats). Fixant un nivell de confiança del 95,5%, l’error màxim d’aquesta mostra és del 2,81%. Es tracta doncs d’un nivell d’error més que assumible, ja que habitualment s’utilitzen errors del 5% o inferiors. Si voleu calcular l’error, ho podeu fer accedint a aquest full de càlcul fent clic a sobre l’imatge.

El segon treball té com a objectiu comprovar si la distribució dels assalariats que cotitzen al règim general de la Seguretat Social per seccions econòmiques de la MCVL-2010, s’ajusta a la distribució que trimestralment proporciona el Departament d’Empresa i Ocupació (enllaç). Per fer aquesta comprovació utilitzo la prova no paramètrica Chi-quadrat de bondat d’ajust. Aquesta prova l’ aplico als assalariats que treballen a Mataró per als quatre trimestres del 2010. La hipòtesi nul·la d’aquest contrast és la següent: la istribució de la mostra s’ajusta a la de la població (nota: s’han agrupat algunes seccions econòmiques, ja que els valors esperats estaven per sota de 5).

La prova s’ha dut a terme amb el paquet estadístic de software lliure R, i el resultat que s’obté és el següent:

                             p-valor

31 de març             0.9841054

30 de juny              0.9707055

30 de setembre    0.9872099

31 de desembre    0.9434755

Amb aquests p-valors no es pot rebutjar la hipòtesi nul·la que la distribució per seccions econòmiques de la mostra dels assalariats que treballen en centres de cotització ubicats a Mataró s’ajusti a la distribució poblacional per als quatre dies seleccionats.

 La sintaxi d’R per dur a terme el trobareu en el següent fitxer: Sintaxi bondat ajust.

El darrer treball que duré a terme té com objectiu comprovar si la data en què s’ofereix informació sobre el total de cotitzants en alta laboral al règim de la Seguretat Social explica adequadament el volum d’assalariats que hi ha hagut durant el mes. Però que vol dir “explicar adequadament”? En aquest cas he optat per utilitzar la mitjana diària d’assalariats de cada mes, si bé una altra possibilitat seria utilitzar la mediana.

Per tant la hipòtesi nul·la a contrastar diu el següent: la mitjana diària d’assalariats de cada mes és igual a la xifra del darrer dia. Per dur a terme aquest contrasta utilitzo una prova no paramètrica –com en el cas de la prova de bondad d’ajust– donat que la distribució de la dades no s’ajusta a la d’una normal, tal i com s’observa a través dels dotze histogrames corresponents als dotze mesos.

Per tant, la no normalitat en la distribució diària de cada mes dels assalariats, fa que la prova a realitzar per contrastar la hipòtesi nul·la plantejada anteriorment sigui la prova de Wilcoxon, i els resultats d’aquesta prova per cada mes del 2010 a Mataró són els següents:

Només en els mesos de setembre i d’octubre, el p-valor de la prova de Wilcoxon aconsegueix un valor clarament superior al 5%, i per tant no es pot rebutjar la hipòtesi nul·la, que diu que la mitjana d’assalariats del mes és igual a la dada del darrer dia del mes. Si observem l’interval de confiança de la prova de Wilcoxon per als mesos de setembre i octubre, s’observa com la xifra d’assalariats del darrer dia dels mesos respectius, es troben dins de l’interval de confiança.

En la resta de mesos el p-valor es troba per sota del 5%, fet que no permet acceptar la hipòtesi nul·la, i per tant se’n desprèn que la xifra d’assalariats del darrer dia és diferent de la mitjana mensual. Com es pot veure en la taula, en set mesos, la xifra d’assalariats del darrer dia del mes es troba per sobre de la mitjana mensual d’assalariats, mentre que en només tres mesos està per sota de la mitjana. Aquests, són els resultats per a Mataró. Si voleu replicar la prova en el següent enllaç hi trobareu la sintaxi d’R: Sintaxi Wilcoxon.

La MCVL és un mostra pensada per fer investigacions a nivell estatal o autonòmic, i el fet de posar a l’abast una mostra tan gran (per sobre del milió de persones) i amb tantes variables (més de 100 variables) permet fer-hi anàlisis per a col·lectius minoritaris. Però els municipis de més de 40.000 habitants també la podem aprofitar per extreure’n dades del nostre municipi. Val a dir, però, que per als observatoris municipals explotar la ingent quantitat d’informació que hi ha en aquesta base dades no és fàcil ja que d’entrada requereix disposar de maquinari i programari adequat per explotar una base de dades amb més de 14 milions de registres (que corresponen a més d’un milió de persones), però segurament el més important és que es necessari dedicar-hi un temps important per conèixer la base de dades. Crec, sincerament, que val la pena dedicar-hi temps a conèixer i explotar aquesta base de dades, ja que, fins al moment, és l’única eina gratuïta –l’únic cost seria el temps que hi dediqui el tècnic– que permet conèixer més a fons una part important del mercat de treball local.

Gerard Reverté Calvet

Servei d’Estudis i Planficació

Ajuntament de Mataró


Més dades a escala local: Expedients de regulació d’ocupació

8 setembre 2011

Seguint la línia del darrer post publicat (impacte de la crisi sobre l’activitat econòmica), el web del Departament d’Empresa i Ocupació de la Generalitat de Catalunya, per mitjà del web de l’Observatori de Treball, posa a disposició de l’usuari diferents bases de dades que permeten analitzar, entre d’altres, les relacions laborals del mercat de treball. En aquest post intentarem explicar quina informació podem extreure a partir dels expedients de regulació d’ocupació.

Abans de seguir endavant en la consulta de la base de dades: Què entenem per regulació d’ocupació? Per definició,[1] el procediment de regulació d’ocupació és l’expedient administratiu d’extinció de contractes de treball (acomiadament col·lectiu), de suspensió temporal de contractes de treball, o de reducció temporal de jornada, basat en causes econòmiques, tècniques, organitzatives, productives, o de força major.

Tornem a la web de l’Observatori del Treball. Un cop hem seleccionat la consulta interactiva de regulació d’ocupació, disposem d’una sèrie de variables a seleccionar, com ara el període que volem consultar (i comparar), el tipus d’informació (nombre d’expedients, treballadors afectats), forma d’acabament de l’expedient o la mesura.

Un cop hem seleccionat aquestes variables, tindrem l’opció de triar l’àmbit territorial objecte d’estudi. És en aquest punt que volem posar especial èmfasi: La base de dades dels expedients de regulació d’ocupació està disponible a nivell municipal, fet prou destacable donada la manca d’informació a escala local.

A tall d’exemple, en el següent gràfic es pot veure l’evolució del nombre d’expedients de regulació d’ocupació, per al municipi de Sabadell, des de l’any 1997 fins l’any 2010. S’hi pot observar com, des de l’any 2009, l’impacte de la crisi situa la xifra del nombre d’expedients de regulació d’ocupació, molt per sobre de la xifra que es venia observant fins aquell moment.

Observatori de l’Economia Local de Sabadell



DGT: Autopistes de dades (II)

20 maig 2011

Mapa temàtic de la matriculació mitjana anual de turismes i tot terrenys de gamma alta per part de persones físiques. Ràtio per cada 1000 habitants. 2004-2006

Mapa temàtic de la matriculació mitjana anual de turismes i tot terrenys de gamma alta per part de persones físiques. Ràtio per cada 1000 habitants. 2009-2010

Els dos mapes amb els quals comença aquest post, és un exemple del resultats que es poden extreure de la base de dades de matriculació de turismes a la qual dóna accés la Dirección Generalde Tráfico (DGT). Són dos mapes temàtics de tots els municipis espanyols, corresponents a la ràtio de turismes i tot terrenys matriculats per persones físiques per cada 1.000 habitants; el primer mapa és del període 2004-2006 –anys de important creixement econòmic–, i el segon és del període 2009-2010 –els anys més durs de la crisi econòmica–.

Possiblement, el fet de poder accedir registre a registre, cada dia de l’any, a la matriculació de tots els vehicles de tots els municipis de l’Estat espanyol, és el més destacat de tot el que proporciona –a nivell estadístic– la DGT. Val a dir, però, que tal i com deixa constància la DGT a través del seu web, aquestes xifres de matriculació són provisionals (enllaç). Això, però, no treu que la informació que proporciona doni una visió molt aproximada a les que puguin donar les xifres definitives.

Evidentment, no cal perdre de vista que es tracta d’un registre administratiu, i per tant no tots els camps estan omplerts. Així, per exemple, un terç dels turismes i tot terrenys matriculats durant el 2010 a Espanya tenien omplert al camp del codi ITV amb el codi SINCODIG, és a dir, sense codi, fet que impedeix saber les característiques del turisme o tot terreny matriculat, com per exemple, la marca, el model, la potència, etcètera. Un altre exemple és el camp d’emissió de CO2: al 2010, el 39,2% dels turismes i tot terrenys matriculats no disposaven de la xifra d’emissió de grams de CO2 per quilòmetre. Malgrat tot ens sembla adient presentar els següents dos mapes corresponents a la xifra mitjana d’emissió de CO2 dels turismes i tot terrenys matriculats per municipi per als anys 2006 i 2010, respectivament.

Mapa temàtic de la mitjana de CO2 que emeten els turismes i tot terrenys matriculats al 2006
Mapa temàtic de la mitjana de CO2 que emeten els turismes i tot terrenys matriculats al 2010

Els mapes mostren com en quatre anys el nombre de municipis que matriculen turismes i tot terrenys que emeten més de 150 g/km han passat de ser majoritaris (4.895 municipis al 2006) a ser minoritaris (758 al 2010). Això, segurament, és conseqüència tant dels ajuts dels governs –central i autonòmic– en la compra dels turismes menys contaminants, com per l’impuls dels fabricants per construir vehicles cada cop menys contaminants, com, perquè no dir-ho, una major conscienciació ciutadana per millorar el medi ambient.

Però a banda de la matriculació de vehicles, la DGT posa a disposició del ciutadà un portal estadístic (http://apl.dgt.es/IEST2/), on es pot accedir a tota una sèrie de dades relacionades amb els vehicles i també amb els conductors. Algunes d’aquestes dades estan disponibles a nivell municipal, com per exemple, l’evolució mensual des cens de conductors per sexe dels municipis de tot l’Estat espanyol (enllaç); o l’evolució mensual del parc de vehicles, segons tipus de vehicle i carburant per a tots els municipis espanyols (enllaç).

A Catalunya, l’homòleg de la DGT és el Servei Català del Trànsit (SCT). Aquest servei també ofereix dades estadístiques a nivell municipal, en aquest cas, sobre accidents de trànsit (enllaç). Val a dir, però, que no tots els indicadors sobre el que es poden fer estadístiques estan disponibles a nivell municipal. En aquest sentit, no es poden consultar les xifres de ferits greus ni de morts en accidents de trànsit a nivell municipal, però si que es poden consultar el nombre d’accidents o d’accidents mortals que han hagut al municipi.

Per tant els municipis (i per extensió altres àrees territorial supramunicipals com les comarques) disposem d’una font estadística molt important que permet fer comparacions entre municipis (i comarques). Si bé les dades que ofereix la DGT –també l’SCT– són millorables, no es pot negar l’importantíssim pas endavant que s’ha donat perquè la ciutadania tingui accés, cada cop, a més i millors dades estadístiques.

Servei d’Estudis i Planificació

Ajuntament de Mataró


Follow

Get every new post delivered to your Inbox.

Join 676 other followers

%d bloggers like this: