Per un perfil open data?

7 febrer 2014

Els darrers anys ha aparegut amb força dins l’agenda de projectes de molts ajuntaments el desplegament de projectes open data. Aquests s’han agrupat en l’àmbit de govern obert, perseguint valors com la transparència, la col·laboració i la participació.

A Catalunya s’han produït iniciatives destacables, tant a nivell nacional amb “Catalunya dades” com a nivell local. Dins les iniciatives locals Terrassa ha estat pionera i diversos ajuntaments mitjans i grans han impulsat projectes propis. La iniciativa “Cloud Barcelona” és especialment interessant per la voluntat d’establir paràmetres compartits entre diversos ajuntaments. No en va Cloud Barcelona agrupa en un sol portal dades de Badalona, Barcelona, Cornellà de Llobregat, Prat de Llobregat, Sant Feliu de Llobregat, Tarragona, Viladecans i Manresa.

Els qui comencem partim d’inventaris de dades que inclouen una diversitat important de dades sobre ocupació, formació, naus i solars, padrons, censos, escoles, expedients, informació comptable, llicències, ajuts, plànols i un llarg etcètera. Aquest llarg etcètera és el que ens obliga a prioritzar i a situar la decisió a nivell polític. No obstant, cada vegada més, constatem que el debat entre l’obertura de dades es decanta a nivell tècnic amb l’obertura de dades per defecte (vegeu Alorza)

Amb aquests antecedents tenim un repte important. Com enfoquem el tema de l’obertura de dades des del perfil de la ciutat? Creiem que el treball acumulat es pot capitalitzar obrint dades del perfil i aplegant-les a iniciatives existents. Sumem?

Imagen

Sergi Morera. Servei Planificació estratègica. Ajuntament de Granollers.


El Cadastre com a font periòdica de dades urbanes (II)

28 juny 2013

En l’anterior post és va explicar quina informació conté l’arxiu 11 que es pot descarregar del Cadastre. A continuació s’explicarà la informació que conté la resta d’arxius que es poden descarregar del Cadastre: els arxius 13, 14, 15, 16 i 17.

• L’arxiu 13 conté els registres d’unitats constructives per cada parcel·la cadastral. En línies generals el concepte d’unitat constructiva coincideix amb el d’edifici, tot i que es poden admetre configuracions diferents a l’haver-hi en el mateix edifici diferents unitats constructives si aquest s’ha realitzat en diferents fases de construcció, o si presenta estats de conservació o zones de valors-trams de ponència diferents. A més, cada unitat constructiva potser urbana o rústica, segons la naturalesa del sòl ocupat (i l’any de la ponència). Llegeix la resta d’aquesta entrada »


El Cadastre com a font periòdica de dades urbanes (I)

26 juny 2013

Presentació

En la “I Jornada de Govern Obert de Terrassa” que va tenir lloc el proppassat dia 20 de juny, en el torn de preguntes de la “Taula de debat sobre Open Data: realment s’estan obrint les dades per a ser reutilitzades?” es va comentar que el Cadastre espanyol és un dels millors del món en quant a l’obertura de dades que ofereix, afirmació amb la qual hi van estar d’acord els quatre components de la taula de debat; de la mateixa manera també és va posar el Registre Mercantil com exemple de que no és obertura de dades.

Durant els següents dos posts –el que es publica avui i el que sortirà divendres vinent– el Sr. Antoni Peiret de l’empresa Cylstat, ens donarà una visió general de les possibilitats que ens ofereix l’accés a les dades cadastrals, tant alfanumèriques com cartogràfiques, que es poden obtenir des del Web del Cadastre Virtual.

La possibilitat de disposar d’una informació que s’actualitza els mesos de febrer, juny i octubre, sobre dades relatives a finques, unitats constructives, construccions, immobles, elements comuns o conreus, és d’un gran interès per analitzar l’estructura de les nostres ciutats i els seus entorns periurbans. Més encara si es tracta de dades que es poden creuar amb altres variables. La gran varietat de dades i la seva complexitat, ha fet que s’hagi hagut de publicar en dos posts, per tal de poder donar una mínima visió que inciti a endinsar-nos en aquesta urb de dades que ofereix el Cadastre. Llegeix la resta d’aquesta entrada »


Afinadors, rellotgers, ortopedes i toreros… Classificacions estadístiques i comunicació de la informació econòmica

21 març 2013

Les classificacions o codificacions (i les seves equivalències) són l’ordre de l’estadística, que és tant com dir que l’estadística no existiria sense les classificacions. De fet, aquesta asseveració pot aplicar-se a tot el mètode científic inductiu, que prové de l’observació de les coses, de persones o de fets, en tant que l’estadística es pot considerar com un conjunt de tècniques, transversal a totes les ciències, al voltant del qual es gestiona la captació, classificació, presentació i anàlisi de fenòmens de forma ordenada, quantificada, amb la finalitat de processar el coneixement, obtenir conclusions i aplicar-les, en última instància, a la presa de decisions. Les classificacions són, per tant, l’essència de l’estadística i, a vegades objecte de maldecaps dels observadors, quan obviem habitualment que emprem codificacions censals que poden o no ajustar-se a la matèria d’estudi que en aquell moment estem treballant. Sovint -massa sovint-, passem per alt la cuina que hi ha rere les classificacions, especialment quan no les creem nosaltres mateixos sinó que venen dades per una convenció. Només sabem dels seus constrenyiments quan, en fer un estudi, ens adonem que la classificació oficial no concorda exactament amb les nostres necessitats d’anàlisi i ens obliga a emprar altres vies d’abordatge, com la que, sense restriccions, ens mostrava en Ramón Culleré fa unes setmanes amb l’exemple de l’Afinador de pianos.

De fet, classificar és tan vell com ho és l’exercici científic o pseudo-científic (sovint relacionat amb una finalitat fiscalitzadora o recaptatòria), perdent-se, doncs, en el túnel del temps. I és un exercici humà: les classificacions estan fetes per persones o per equips de persones i, malgrat l’expertesa tècnica i la saviesa d’aquelles, les seves conclusions (que un cop acordades afecten per un temps la comunitat estadística) no estan mai exemptes de subjectivitat. Així, és de creure que els classificadors s’han degut molt sovint a vel·leïtats personals, que a voltes s’han plasmat en les classificacions, la qual cosa fa que unes presentin molt detall sobre determinades activitats que personalment els han pogut ser més pròximes i que, per contra, n’hi trobem mancança en altres que els hi devien ser més alienes. Això és especialment evident quan la matèria d’estudi és de caire econòmic o social, i més encara quan l’activitat estudiada és transsectorial o transgredeix l’enfocament clàssic de la classificació sectorial.

Haurem de parlar, per tant, d’una psicologia de les classificacions (o dels classificadors), o d’una espècie de metaclassificacions, que en definitiva no són tan obvies i poden afectar enormement la nostra feina com a observadors de la realitat local. No endebades, com deia l’eminent Milton Santos (geògraf brasiler, estudiós de l’evolució del fenomen urbà) és quan s’augmenta d’escala que els intersticis de la ciència es fan més evidents: “Quant més petit és el lloc examinat, tant més gran és el nombre de nivells i determinacions externes que incideixen sobre aquell. D’aquí la complexitat de l’estudi del més petit” (“Espacio y método”, Geocrítica 65, UB, 1986). El mateix es pot aplicar quan s’augmenta la concreció de l’objecte d’estudi.

Dibujo25

Serà per això de les dèries terrenals que en la codificació vigent de l’IAE a 5 dígits (informació tan recurrent per als estudis locals, des de la implantació de la Llei 39/1988, Reguladora de les Hisendes Locals) hi trobem fins a 9 epígrafs diferents per activitats relacionades amb la Fabricació de rellotges (epígrafs de 1-3991 a 1-3999), mentre que, per contra, en d’altres casos, per exemple el Comerç d’aparells òptics i el Comerç d’aparells ortopèdics els negocis apareixen agrupats en un únic epígraf, quan tant s’evidencia que són negocis força més diferenciats entre sí. I així podem trobar força exemples de diferent nivell de detall entre les classificacions que presenta aquella codificació, dels quals potser el més curiós sigui l’especificat a les activitats artístiques relacionades amb espectacles taurins (fins a 6 tipus diferents, del 3-510 al 3-590; als que s’ha d’afegir algun altre més entre els codis genèrics), especialment tenint en compte la gran transcendència d’aquelles activitats per a l’economia catalana. Per entendre aquests contrastos potser hauríem de saber més sobre les circumstàncies que influenciaren el classificador… que, en el nostre cas, ens pot fer pensar que provenia d’una família de rellotgers, afeccionats a les curses de braus!

Tanmateix, en aquestes vicissituds tant ens hi trobem quan tractem de fer un estudi sobre una activitat molt determinada (per exemple. estudiar el mercat dels Afinadors de pianos a Manresa), com quan, des d’una altra perspectiva, ens esforcem a simplificar agrupacions amb finalitats de comunicació de la informació, per exemple, en els casos de generació a internet d’utilitats per a la informació ciutadana (llegendes dels SIG aplicats a portals web, que no admetrien llistats interminables), tenint en compte que els conceptes de les classificacions oficials solen ser inintel·ligibles per als ciutadans de peu. I aquest exercici tampoc és baladí ni està mancat de dificultat.

Per al cas de la codificació de l’IAE, el repte que es planteja és el de l’adaptació d’una classificació concebuda per a facilitar la gestió tributària de l’administració local (que en el seu nivell màxim de desagregació conté fins a 1.059 epígrafs), a unes necessitats d’ús de les quals se’n desprenen nous requisits d’organització de la informació força diferents a la gestió administrativa.

A aquest repte ens hi hem llançat recentment, juntament amb d’altres serveis de l’Ajuntament de Terrassa, en el marc del projecte d’elaboració d’un Portal de la Promoció Econòmica, que, per a l’assoliment dels seus objectius previstos, requereix, entre d’altres, d’una reconceptualització del cens d’activitat econòmica administrat pel servei encarregat de la gestió de les llicències i dels tributs municipals.

Hem plantejat una reformulació de manera que, garantint la consistència absoluta de la informació, s’assegurés la complerta reversibilitat del procés i la seva actualització permanent (per mitjans automatitzats), i que havia de cristal·litzar en una nova classificació que suposés guanys significatius en termes d’adaptabilitat i comprensibilitat en ares a la difusió del coneixement sobre l’activitat econòmica a la ciutat. El repte és, per tant, desmuntar l’estructuració multinivell  de la classificació de l’IAE –seccions, divisions, agrupacions, grups i epígrafs- per adaptar-la a la lògica que es desprèn en la conceptualització del projecte a emprendre: la sistematització de la informació a partir de la seva simplificació per tal d’aprofundir en la seva comprensibilitat ciutadana tot maximitzant la seva capacitat explicativa.

D’aquesta tasca (per a la qual hem fet jugar tècnics de diferents serveis implicats en la gestió de la informació econòmica del municipi, en unes quantes i feixugues sessions de treball) n’ha sortit una classificació de l’activitat econòmica estructurada en 110 categories definides per nous epígrafs genèrics que busquen aportar el màxim d’informació a l’usuari final sobre el ventall d’activitats que poden arribar a contenir, de la qual en resulten algunes com els Serveis tècnics i professionals que aglutinen fins a 96 epígrafs de l’IAE, les activitats de Comerç a l’engròs que en conté fins a 62, o la Indústria alimentària que agrupa 54 epígrafs, totes elles amalgamant tant activitats empresarials com professionals o artístiques.

Situació de les indústries tèxtils als polígons del Sud de Terrassa, emprant el Portal SIG municipal

Situació de les indústries tèxtils als polígons del Sud de Terrassa, emprant el Portal SIG municipal

Aquesta proposta de classificació simplificada i entenedora (que té la vocació de constituir la llegenda del mapa de situació en la web) no ha d’obstar perquè quan des del SIG s’accedeixi a la localització dels establiments a través d’icones, al clickar-hi se n’hi recuperi, a més de les dades bàsiques de contacte, informació de detall sobre la classificació de les activitats (5 dígits) que allí s’hi desenvolupen, a banda, és clar, de tota aquella informació associada que permeti a l’usuari afinar la seva tria.

Amb tot, els que hem participat en aquesta aventura, malgrat la nostra experiència en l’anàlisi i presentació de les dades, malgrat la nostra lògica i criteris comuns, no ens hem pogut substraure de les dèries personals, i ho hem pogut plasmar en un debat ric en matisos i en el mateix resultat de la proposta (encara esborrany), fins i tot en posar de manifest les contradiccions mateixes d’un sistema de classificacions (de més de 20 anys de solera) al que segurament li cal una profunda revisió.

Xavier Muñoz i Torrent i Marc Armengol i Rabal, Observatori Econòmic i Social i de la Sostenibilitat de Terrassa


Crowdsourcing i open street map

19 octubre 2012

D’uns anys ençà ha anat agafant cos el concepte de crowdsourcing com a instrument o procés de captura oberta d’informació (terciarització massiva). El plantejament d’un procés de crowdsourcing és simple: la resol·lució d’un problema vinculat al coneixement o obtenció d’informació es planteja de forma oberta (anònima) a un conjunt d’usuaris, generalment amb poques restriccions, de forma que aquests, individualment, van corregint o aportant nous inputs fins assolir un objectiu determinat, generalment mai conclòs pel que fa al grau d’actualització.

 Els processos de crowdsourcing van paral·lels a l’extensió de les tecnologies de la informació i les possibilitats d’interacció entre usuaris i emissors. El conjunt de la societat passa a ser un emissor d’informació que, alhora, decideix i assenta criteris per a validar-la, de manera que la suma d’individualitats acaba configurant un criteri general en el tractament i difusió de la informació.

 Un cas interessant d’aplicació de criteris de crowdsourcing vinculats a la geolocalització és la plataforma Open Street Map. La descripció que apareix a la pròpia web de la plataforma és prou indicativa del seu abast i intencionalitat: “L’OpenStreetMap (OSM) és un mapa editable i lliure de tot el món. Està fet per gent com vós. Les dades poden ser baixades i usades lliurement sota la seva open license.”

En el marc del concepte ampli d’Open Data, OSM ofereix una plataforma oberta d’accés a la informació cartogràfica en el que l’element essencial és la comunitat d‘usuaris que a través de les seves aportacions, milloren la cartografia de base existent i a partir d’aquesta base poden representar lliurement informació temàtica o derivada. És, per tant, un contenidor de dades geogràfiques en sentit ampli en el que la seva força recau sobretot en la llibertat d’ús de la informació (format obert) i la immediatesa i facilitat en l’actualització. No és sorprenent que empreses com Apple o aplicacions com Foursquare optin per OSM en contra de Google Maps com a base de publicació.

El crowdsourcing, i concretament OSM,  en una societat cada vegada més espacialment identificada, està  obrint oportunitats en el fet de com els professionals i els ciutadans col·laboren en la identificació de canvis o, en sentit més obert, en la captació de la informació. L’ús de tecnologies de posicionament personal (smartphones), l’increment de servidors de cartografia en format obert (OGC), l’impuls del concepte de les open data (especialment des de les administracions),  la integració del geoposicionament a les xarxes socials en entorn web, Galileo,…  tot plegat obre un escenari d’un enorme potencial en el seguiment de dinàmiques territorials i socioeconòmiques. El repte és com fer compatible les fonts d’informació amb caràcter oficial (fiabilitat, rigor, precisió, sistemàtiques) amb noves fonts d’informació obertes (immediates, massives, exponencials, lliures, universals).

Girona_OSM

L’Ajuntament de Girona, des de 2009, ofereix cartografia del municipi a través de la plataforma OSM .

Jordi Xirgo
Cap de la Unitat Municipal d’anàlisi territorial (Umat) – Ajuntament de Girona


Els sistemes d’informació a l’ull de l’huracà: la disponibilitat de la informació del sector públic mou l’economia

22 juny 2012

La disponibilitat d’informació socioeconòmica ha estat essencial per a traçar estratègies de desenvolupament, tant per a qui, des del poder local o nacional, ha de prendre les decisions públiques (en funció de l’anàlisi territorial, prospecció socioeconòmica i l’avaluació), com per qui ho ha de fer en el camp de la decisió privada, que, en els temps que corren, és tant o més important, per l’encaix de l’empresa en el territori, en el conjunt productiu i en la comunitat. Se’ns fa de nou evident, per exemple, la utilitat de la informació local per determinar el millor emplaçament per a un negoci comercial de proximitat o per a orientar el consum de les persones, o, a una altra escala, per saber on localitzar una indústria, seguint els condicionants de sòl disponible, de proveïment o de logística general. I, més encara, ha suscitat un metainterès d’empresa: els estudis de localització d’activitats humanes o el data-mining han especialitzat un segment del sector de la consultoria professional, arribant a crear un nínxol de mercat ben diferenciat, que sovint s’ha mostrat tant competitiu com concorregut a l’hora d’assistir les decisions sobre la ubicació de grans empreses o a l’hora d’acompanyar projectes estratègics de ciutat, generals o sectorials. Els plans directors de l’activitat comercial, o els de dinamització dels sectors industrials n’han estat exemples clars, on la informació no només s’ha emprat per analitzar la realitat i per substanciar les decisions, sinó també per a la publicitat tant dels negocis com del contingut i del resultat de les polítiques públiques.

Tanmateix, és en els moments de crisi quan, més que mai, es posa de relleu la necessitat de poder treballar amb informació estratègica fiable i actualitzada, d’una banda, per facilitar al màxim el coneixement a la ciutadania, així com per emprar-la en la dinamització dels diferents sectors d’activitat. Es passa gairebé a invitar les empreses a tots nivells a emprar la informació pública disponible i convertir-la en coneixement estratègic per a l’èxit dels seus negocis o en matèria primera del seu procés productiu, entenent que això ha d’ajudar a mantenir el nivell d’activitat i també a generar treball. Un cop més, la informació pública local està, doncs, a l’ull de l’huracà com un dels elements a través del qual es considera que es pot generar idees de negoci, visualitzar oportunitats, posicionar-se en el territori, diferenciar productes i extreure’n valor afegit. És també en aquests aspectes que les vies de facilitar la informació s’han hagut d’adaptar, donant als usuaris la possibilitat de poder jugar amb dades més afinades relatives a l’àmbit local, i no només respecte del què ja hi ha, sinó del què hi pot haver i del que s’hi pot fer amb les dades.

De fet, des de fa aproximadament 15 anys s’han anat succeint noves vies de difusió de dades del sector públic, en funció també d’una demanda creixent a l’entorn de l’impuls del management modern i la pujança de la governança, o, si més no, per considerar que l’accés a la informació pública és un dret dels ciutadans i a la vegada una necessitat de transparència de la realitat i dels resultats de les polítiques publiques del territori i, per tant, també, base del màrketing de les administracions, constituint també un principi de la concertació. A la publicació de les dades estadístiques a les webs corporatives en formats d’anuari, de resums del padró municipal o d’informes d’evolució de la conjuntura, s’hi ha anat afegint, paral·lelament al desenvolupament i extensió dels entorns digitals, altres formes d’oferta de la informació amb la pretensió de maximitzar-ne l’accés, la usabilitat i l’ús, mitjançant l’establiment de plataformes ideades sobre sistemes d’informació geogràfica (en base a la georeferenciació, com poden ser les plataformes SIG dedicades a la informació sobre polígons industrials o al comerç urbà, que sovint acompanyen portals especialitzats), com, en darrera instància, l’assaig de plataformes d’open-data, amb (o sense) interfícies de consulta de les diferents bases de dades relacionals i la seva combinació. Hem viscut, de fet, una acceleració dels mètodes de presentació de la informació socioeconòmica que hem de relacionat amb canvis substancials de paradigma sobre la transparència de l’acció pública, simptomàticament passant de l’estricta reserva de les dades (que només se servien prèvia sol·licitud o mitjançant la compra d’anuaris editats en paper) a la publicació de seleccions digitals tancades en documents en acrobat; per optar ara per facilitar les matrius en codi obert o en formats de consulta que han de permetre la reutilització de les estadístiques, amb la idea de contribuir a un aprofitament més gran de les seves possibilitats i a impulsar la competència i la innovació en el camp de la gestió del coneixement (vegeu la lletra del Reial decret 1495/2011, de 24 d’octubre, pel qual es desplega la Llei 37/2007, de 16 de novembre, sobre reutilització de la informació del sector públic). 

Nogensmenys, la disponibilitat de dades a través de les plataformes d’open-data s’adreça, més enllà d’un motiu de transparència, a l’oportunitat de desenvolupar negocis basats en l’anàlisi i tractament directe d’aquelles matrius d’informació que faciliten en obert les administracions públiques, que han de permetre, per tant, fer operacions avançades i ràpides de les sèries liberalitzades, interessant tant les dades quantitatives (estadístiques i de geoposicionament o georeferenciació) com qualitatives (programacions d’activitats, notícies, concursos, documentació d’arxiu, patents, catàlegs, etc). Aquesta obertura ha fet i farà créixer l’oferta de serveis o productes privats que jugaran amb la mineria de dades, el seu tractament, la seva explotació i/o la seva publicació, ja sigui gratuïta (finançament per mitjans diferits) o de pagament (com ja han vingut fent algunes empreses amb bases de dades privades). Es tracta, per tant, de donar ales a l’eclosió de nous tipus de negoci basat en l’aprofitament social de les dades.

En aquell sentit, en una recent avaluació prospectiva (impact assessment) que acompanyava la proposta de Directiva Europea sobre reutilització de la informació gestionada pel sector públic, es deia que l’impacte econòmic directe i indirecte de obertura de les fonts d’informació públiques podria generar anualment en l’àmbit de la UE a l’entorn de 140 B€ de negoci, de procedir-se a l’homogeneïtzació del mètode de presentació de les dades [aplicació d’uns estàndards europeus que permetin la interoperativitat i la possibilitat d’ús compartit, com ja succeeix per a la infraestructura de les dades geoespacials en el cas de la cartografia] i a l’obertura gradual de les bases a tots els nivells d’administració. A Espanya, el volum de negoci estimat el 2009 en activitats directes de reutilització de la informació pública se situava per damunt dels 550 M€, mentre que el total devia aproximar-se a 1,6 B€, essent comparable al volum generat per la indústria dels videojocs. Estem parlant, doncs, d’un volum de negoci gens menyspreable, especialment si es tradueix en la generació de nou teixit empresarial en el sector de les tecnologies del coneixement i, conseqüentment, en l’augment de la demanda de personal especialista [dissortadament, l'informe no concretava xifres de l'impacte en termes d'ocupació laboral]. De fet, no són poques les empreses que en els darrers temps s’han creat a l’entorn de l’explotació de les dades públiques, molt en especial en la generació de continguts útils per moure’s per la ciutat, com ara en el camp de la georeferenciació i el posicionament en el mapa de serveis i empreses, mitjançant entorns web o per a mòbil, que està desembocant en novadores utilitats de realitat augmentada, que aprofiten les plataformes d’informació existents. Es tracta d’un camp que sembla tenir un recorregut inesgotable.

Malgrat les possibilitats de l’obertura de la informació del sector públic i l’evident exercici de transparència de la informació, el tractament de les matrius que es posin a disposició serà operatiu només a mans d’experts. Així doncs, a la pràctica, gran part d’aquesta obertura no s’adreça al gran públic, sinó a un de força especialitzat; així per tant, a la generació d’intermediaris de l’aprofitament de la informació. Les administracions públiques, per la seva part, adopten el rol de mines de dades, a partir de les quals les empreses del sector poder capturar matèria primera per a la seva producció, de forma directa, ràpida i a un cost mínim, aparentment per contribuir, a canvi, amb innovació metodològica i nou coneixement, donant dinamisme al mercat i generant llocs de treball qualificats.

Amb tot, atès el caràcter global de l’accés a aquestes operacions, les bondats de l’impacte sobre el teixit empresarial i l’ocupació no necessàriament guardaran relació amb el territori d’on provenen les dades, i això malgrat que per a les administracions interessades hi haurà un cost mínim d’adaptació i que aquest no podrà ser finançat amb la venda de la informació. En altres paraules, els efectes beneficiosos no necessàriament hauran de redundar sobre l’economia local, si no és en forma d’accés a nou coneixement sobre la pròpia realitat, o, en els termes de les condicions de cessió, que doni la possibilitat d’emprar les mateixes plataformes obertes, també per al data-mining que l’administració local pugui fer d’altres administracions públiques o institucions o àdhuc d’empreses, si aquelles també s’apliquen el mateix principi de treball en codi obert.

Conseqüentment, la posta en marxa del nou estadi en l’entramat dinàmic de les TIC no exclou l’explotació, selecció i difusió de les dades per les pròpies administracions, ni evidentment el treball de recopilació de la informació, ni tampoc el treball de síntesi, executat fins ara pels Observatoris o d’altres serveis públics municipals, car es tracta el seu d’un treball que té per finalitat la intel·ligibilitat de la informació i la seva conversió en coneixement apte per a la seva lectura i interpretació, la generació d’opinions, el seu contrast i, en general, la seva utilització en l’administració de recursos i en presa de decisió. En aquest context, el paper dels observatoris serà tant o més necessària. Molt en especial, els serveis hauran de prodigar-se en aquella síntesi que permeti que la informació i el coneixement essencial arribi a tos els ciutadans i que es garanteixi a aquells la mateixa obertura que s’ofereix a les empreses especialitzades.

En això, revestirà especial interès respecte de l’open-data l’existència en aquelles plataformes d’interfícies de presentació i d’explotació, el màxim d’intuïtives; per exemple emprant menús conceptuals i utilitats gràfiques, que permetin visualitzar on-line la informació i la seva evolució en el temps o la seva distribució en l’espai, i accedir a aquella informació clau que afavoreixi l’actuació sobre el territori, no només administrant-lo, sinó facilitant aspectes bàsics com localitzacions de recursos a la producció, com pot ser coneixement sobre l’oferta i la demanda del sòl i el sostre d’activitat econòmica en el municipi, o sobre l’existència o no de competidors, o sobre les activitats que poden ser auxiliars o complementàries a la pròpia producció. També interessarà un altre aspecte fins al moment poc formalitzat, que és el de la participació en l’observança i els seguiment de la informació bàsica i en el feed-back sobre el contingut a cada moment les bases de dades (aspectes especialment importants si sobre l’actualització de la informació s’ha de fonamentar una anàlisi que redundi sobre el benestar de les persones i de la comunitat), que presumiblement no faran altra cosa que abundar en la corresponsabilitat ciutadana en un dels aspectes essencials de la governança, que és el coneixement puntual i la conscienciació sobre l’estat i de les tendències de la ciutat o del territori.

Xavier Muñoz i Torrent, Observatori Econòmic i Social i de la Sostenibilitat de Terrassa


Quants n’hi ha de funcionaris?

25 abril 2012

Arrel de les retallades en el sector públic, el nombre de les persones a sou de les administracions públiques (funcionaris, però no només) ha estat un dels temes recurrents a l’hora de cercar sol·lucions per disminuïr els elevats nivells d’endeutament d’aqueslles. Però, sabem quantes persones hi ha ocupades als diferents nivells de l’administració pública catalana? Sabem si han augmentat darrerament o bé han disminuït? Sabem quantes n’hi ha al nostre municipi/comarca i com es reparteixen? Des de fa poc tenim una nova eina a la nostra disposició que ens pot ajudar a respondre aquestes preguntes: el Banc de dades sobre ocupació pública.

El Departament de Governació i Administracions Públiques de la Generalitat de Catalunya té en l’anomenat Espai d’anàlisi de l’ocupació pública l’instrument per recopilar i analitzar les dades referents a l’ocupació a les administracions públiques catalanes. Per desenvolupar aquestes funcions, l’Espai disposa de diverses eines, la més important de les quals és la base de dades sobre ocupació pública presentada els primers mesos de 2012. Aquesta base de dades té el seu origen en la voluntat de resoldre la dispersió de dades que hi havia sobre ocupació pública i que ocasionava diversos problemes i, alhora, respondre a les demandes de transparència sobre aquest tipus de dades d’ocupació pública configurant-se un datawarehouse, la façana del qual és el Banc de dades.

Les dades proporcionades per l’explotació del banc de dades tenen la condició d’oficials en tant que han passat a formar part del Pla Estadístic de Catalunya, fet que en reforça la continuïtat i l’actualització per part d’aquells organismes de l’administració local als quals cal demanar-les. A partir del Banc de dades, i a banda de les consultes que permet, se’n deriven 4 tipus de productes:

  • Un sistema d’indicadors sobre el que s’està treballant i que ha de publicar-se en breu.
  • Un butlletí trimestral que difon regularment les dades més destacades: La mirada trimestral.
  • Uns informes monogràfics més extensos que aprofundeixen en temes derivats de l’anàlisi de la base de dades: Gran Angular.
  • Un Informe d’ocupació pública, de caire anual.

Centrant-nos en la Banc de dades, aquest s’estructura al voltant de 3 eixos:

1. Administració de la Generalitat de Catalunya.- Forma el gruix de la base de dades incloent el personal d’estructura dels diferents departaments i ens públics de la Generalitat, no incorporant ni els substituts ni els reforços. Les dades s’actualitzen mensualment i s’obtenen a partir del registre de personal unificat de tots els departaments. No s’inclou el personal d’empreses públiques, consorcis i fundacions. Es tracta d’un registre ‘viu’ que s’actualitza constantment ‘corregint-se’ si cal durant un període de 12 mesos i fins al tancament que es fa amb les dades de desembre com a referència.

Les variables que inclou fan referència al col·lectiu (administració, agents rurals, docents, cosos de seguretat, etc.), la vinculació (funcionaris, eventuals, interins, etc.) o el grup (A1, A2, C1, etc.)  amb la possibilitat de creuaments per sexe, edat o discapacitació.

2. Sector públic de la Generalitat.- Inclou les dades anteriors més les proporcionades per les empreses públiques, consorcis i fundacions dependents dels diferents departaments. En aquest cas la referència de les dades és anual (no mensual com l’anterior) doncs la informació que no depèn directament de la Generalitat (registre unificat de personal) s’ha de recollir a partir d’una enquesta anual a cada ens.

Les variables i els creuaments possibles són similars als anteriors amb la diferència que parlem de dades anuals i d’una sèrie amb dades 2004 i 2008-2010.

3. Administracions catalanes.- Inclou les dues anteriors (excepte consorcis i fundacions) i, a més, les corresponents a l’administració local, és a dir: ajuntaments, consells comarcals, diputacions, entitats metropolitanes, mancomunitats i entitats municipals descentralitzades(EMD); també el personal  corresponent a les Universitats públiques  i el dels Ens parlamentaris i organismes independents (Parlament de Catalunya, Síndic de Greuges, etc.). No s’inclou el personal conjuntural sinó només el d’estructura. També inclou empreses públiques i organismes autònoms dependents d’aquestes administracions.

Per a les entitats locals, la informació més rellevant és la que trobem en el tercer apartat, on podem fer cerques per municipi i saber el personal que hi ha assignat corresponent a l’administració de la Generalitat o a l’administració local i per les diferents variables: tipus d’ens, vinculació, col·lectiu, sexe o grup.

Un exemple de les explotacions possibles és la que ens mostra el nombre de personal de l’administració pública dels municipis del Perfil de la Ciutat i la posició que aquests ocupen prenent com a indicador el personal de les administracions públiques per cada 1.000 habitants.

Per cert, el 2010 el total de personal de les administracions públiques catalanes (recordem que no hi ha comptat el personal de l’administració de l’Estat) era de 301.781 persones, (un 1% més que el 2009), és a dir, 40,7 ‘funcionaris’ per cada 1.000 catalans. Una altra qüestió és si són molts o pocs treballadors públics…

Enric Sanllehí i Bitrià, Observatori Econòmic i Social i de la Sostenibilitat de Terrassa


I això de la Llei de Transparència, què és?

13 abril 2012

En aquest blog s’ha debatut moltes vegades sobre la necessitat d’obrir les dades (opendata), de fer més accessible la informació i de posar-la en disposició dels ciutadans i ciutadanes. Malgrat que s’ha avançant lleugerament en aquest camí, com ens mostren alguns dels posts publicats en aquest espai sobre l’Opendata o bé la transparència en els Ajuntaments, encara queda un món per davant per tal d’apropar-nos, ni que sigui una mica, a països com els Estats Units d’Amèrica o el Regne Unit, on posen a disposició del ciutadà un volum ingent d’informació i dades de manera senzilla i ordenada.

En aquest sentit, en el nostre país (aquí englobem a Govern central, les Comunitats Autònomes, Diputacions, Ajuntaments, etc.) ens trobem amb una gran falta d’accessibilitat a la informació que en d’altres llocs, no tan allunyats, disposen sense gaires problemes.

El fet de ser l’únic país europeu (en tràmits de deixar de ser-ho) amb més d’un milió d’habitants sense tenir en vigor una Llei de Transparència no parla gaire bé del nivell de la democràcia en el mateix. En el nostre ordenament jurídic tan sols es defensa l’accés del ciutadà a conèixer l’estat i el moment en el que es troba un procediment determinat, en el marc de les relacions persona-administració. I és que sense una Llei que garanteixi l’accés a la informació per part del ciutadà, una llei que obligui als treballadors públics a ajudar als ciutadans i ciutadanes a aconseguir les dades que requereixin (sempre que compleixin la LOPD, que no es tracti de temes de seguretat nacional, afectin a informació de secrets comercials o bé a qüestions de prevenció o investigació de delictes), no podem parlar de país avançat, de control de la governança, o de democràcia completa en temes de transparència.

Un exemple il·lustratiu i comparatiu al respecte és la qualitat i quantitat de la informació sobre els crims perpetrats al Regne Unit (cas concret d’Irlanda del Nord) i a Espanya. En el cas del Regne Unit, en una sola fulla trobem amb tot detall els crims que han ocorregut en els últims 12 mesos en l’àrea determinada, comptabilitzats i desglossats en les diferents tipologies considerades (delictes de violència contra la persona, delictes de robatori o delictes sexuals, per citar alguns exemples).

Exemple d’informació de criminalitat a Irlanda del Nord

En el cas de l’informe que posa a disposició el Ministerio del Interior de l’Estat espanyol, la informació facilitada està distribuïda en diferents pàgines, ofereix taxes en comptes de valors absoluts en les desagregacions i el quadre resum que ens mostra els valors absoluts només recull la informació en grans blocs / indicadors.

Exemple d’informació de criminalitat a Espanya

Continuant amb els exemples de les estadístiques de crims, i en el cas de les estadístiques que disposa el Regne Unit, en el següent enllaç trobem tot un seguit de variables i documents que poden descarregar-se per ser analitzades i interpretades, en un format Excel, que prenen aquesta forma quan el descarreguem.

A Espanya, en canvi, arribar a segons quina informació suposa realitzar peticions específiques als diferents departaments o secretaries dels ministeris, sense que això signifiqui que es rebrà una resposta al respecte. Tal i com demostra ‘la campaña de las 100 preguntas’, realitzada per la plataforma Coalición Pro Acceso, que consistia en enviar un total de 100 preguntes (finalment van ser 113) a les autoritats públiques corresponents i monitoritzar les seves respostes, els resultats de la campanya demostren com pràcticament un 50% de les preguntes van ser “respostes” amb silenci administratiu, mentre que només un 20% van rebre alguna resposta positiva amb la informació requerida rebuda.

En la mateixa Xarxa del Perfil de Ciutat, ens hem trobat amb silencis administratius quan s’ha demanat certa informació, inclús alguna en que anteriorment s’ens havia facilitat, o bé ens han denegat la transmissió de certes dades que quan s’ha donat un canvi de Govern aquestes han vist la llum sense massa inconvenients.

És per això que es fa necessària la implantació d’una Llei de transparència en el nostre Estat. Malgrat que, com apunten els experts, l’avantprojecte de Llei de transparència presentat per l’actual govern de l’Estat espanyol pugui ser millorable, cal una norma que obligui a les institucions públiques a posar en circulació la informació de la que disposen, obrir les seves bases de dades i oferir a la ciutadania la possibilitat de consultar, controlar, accedir a una informació que ajudaria a millorar la qualitat de la democràcia i més en un moment de dificultats com l’actual.

I és que davant un món en el que no s’han de donar explicacions més enllà de les eleccions, una societat en la que només apareixen les dades que interessen al partit del govern del moment, o un poble que no pot controlar de manera senzilla i eficaç l’activitat i actuacions dels seus governants, les probabilitats d’ineficàcia governamental, que apareguin casos de corrupció, o bé que es portin a terme activitats o processos que són contraproduents, són més grans que no pas en una societat en la que la transparència sigui el denominador comú.

————

Enllaços d’interès:

Global Right to Information Rating

Coalición Pro Acceso

Proyecto de Ley de Transparencia

Access Info Europe

Sin noticias de muertes, infecciones y listas de espera

Ley de Transparencia Ya

Transparency Internacional España

NYC Open Data

Opening up government – UK

————

Observatori Socioeconòmic de Grameimpuls, SA – Ajuntament de Santa Coloma de Gramenet


Opendata: obrir les dades de les empreses de serveis públics també (III)

6 abril 2012

Com responsables de generar estadística dels ajuntaments respectius podríem dir que els observatoris municipals tenim fam de dades, que bona part de la feina nostra és estructurar, difondre i fins i tot interpretar totes les dades que existeixen, dispersades aquí i allà,  sobre els nostres municipis. Dades procedents de diferents entitats, produides per diferents organismes.

Quina és la font primària de les dades dels  municipis que treballem des dels observatoris?. Habitualment, en el 95% dels casos o més, son producte del buidat de registres informàtics producte de registres administratius, la majoria lligats a les funcions fiscals i recaptatòries, o de control,  de les diferents administracions: registres de la seguretat social, llicències d’activitat, de circulació, de construcció d’habitatges etc… A qualsevol registre administratiu hi ha el domicili del fet imposable i, per tant, és una dada territorialitzable a nivell municipal i fins i tot geoposicionable amb exactitud mil·limètrica sobre el territori.

Encara hi ha molta feina per fer alhora de treure profit tant dels registres administratius propis dels ajuntaments com, sobretot, dels registres dels diferents ministeris i conselleries. Els observatoris municipals anem avançant força en aquest sentit a base de contactar amb els diferents serveis de documentació o planificació de les administracions superiors que produeixen cadascuna de les dades.  Que ens facilitin les respectives dades municipalitzades acaba depenent de l’obertura del responsable polític de les dades o de l’esperit col·laboratiu dels responsables tècnics d’aquestes.

Però hi ha una altra font de dades encara pràcticament inexplotada per la dificultat d’accedir-hi: les dades de les companyies de serveis públics en règim de concessió. Operadores de telecomunicacions, companyies elèctriques,  de gas, d’aigua, autopistes, companyies de transport públic, etc. Companyies que abans eren empreses públiques, monopolis públics, però que es van privatitzar i ¿liberalitzar? durant les dos darreres dècades.  I que tenen a les seves bases de dades un coneixement preciòs per l’interès públic. El consum energètic, la mobilitat i el consum d’ample de banda a les diferents barris i zones de les nostres ciutats son unes dades valuosíssimes per al planejament urbanístic, econòmic i social de les nostres ciutats. Per posar un exemple: com es pot fer politiques sostenibilistes sense conèixer al detall els consums energètics de les diferents zones de la ciutat?. Com planificar la mobilitat si sols tenim dades de mobilitat de transports públics anuals i fragmentades per operadors o concessionaris diferents?.

La majoria d’aquestes companyies, bona part d’elles potents multinacionals, com a grans empreses que gestionen milions de clients i desenes de milions de facturació, tenen potentíssims datawarehouses sobre els que apliquen tècniques de mineria de dades per a fer previsions de consum, detectar fraus, o per fer scorings dels clients (cada client rep una puntuació de la capacitat de consum, o del perill de que sigui un moros, o d’altres variables rellevants per al model de negoci i la relació amb el client). És a dir, tenen una capacitat per a extreture dades de forma estructurada, i analitzar-les, practicament ilimitada. Pel que fa als nostres interesos, aquests sistemes informàtics poden extreure amb suma facilitat dades agregades a nivell territorial amb el màxim de granularitat territorial que es necessiti: dades per província, per municipi, per secció censal, per illa cadastral i, si es vol, per edifici, habitatge, persona… No hem d’oblidar que tenen sistemes SIG integrats indispensables per al seu negoci, i que en aquests traballen sobre la cartografia oficial, com la cartografia catastral.

S’imaginen aquesta potencia analítica al servei de les ciutats, de la planificació de la ciutat?. Jo si que m’ho imagino, i per això no comprenc encara com, en el procés de liberalització de serveis públics essencials no s’ha obligat (reglamentat) a les companyies a compartir les dades de interès públic a alts nivells de granularitat i desagregació (illa cadastral, per exemple). Si més no, amb les administracions públiques!. Que siguin enpreses de titularitat privada no és motiu suficient, al meu parer, pel tancament de dades originades en l’exercici de les seves funcions públiques. El fet és més incomprensible encara des del moment que són uns sectors amb preus i serveis regulats i, per tant, de planificació pública en darrer terme. Com es pot planificar i regular be sense dades detallades?

Generalment, son els organismes reguladors com la Comision del Mercado de las Telecomuniaciones o la Comision Nacional de la Energia,  els que publiquen dades agregades a nivell estatal o, com molt, autonòmic, a partir de la seva funció principal de vetllat per la competència al sector i assegurar els serveis públics obligatoris per llei. Dades que els faciliten les companyies i que es publiquen a nivells d’agregació territorial altíssims: l’estat sencer.

Anem a veure amb una mica més de detall el panoràma de dades municipals en un parell de sectors que em treballat recentment al nostre ajuntament, per tal d’exemplificar, en casos concrets, la problemàtica del tancament d’aquestes fons de dades.

Cas 1. Les dades del sistema energètic.

Actualment, a l’ajuntament de Rubí, s’està desenvolupant un ambiciós projecte de promoció de l’estalvi i l’eficiència energètica de caràcter integral, amb la voluntat de incidir tant sobre el consum del propi ajuntament com sobre el consum de la industria, el comerç i el sector residencial del municipi: www.rubi.cat/energia. En el marc d’aquest projecte portem ja cert recorregut de recerca de dades de consums energètics al nostre municipi i a les diverses zones d’aquest, amb resultats desiguals.

El que hem aconseguit…

Les companyies energètiques no publiquen res!. A nivell de consum energètic als municipis sols  hem trobat les dades elaborades per l’ICAEN a partir de les dades que li subministren les diferents companyies: consum anual d’energia elèctrica i gas natural canalitzat al municipi, i per sectors (residencial, comerç, industrial).  Son dades sempre agregades a nivell de tot el municipi, i publicades amb 3 anys de retard. Ara mateix sols tenim les dades fins el 2008.  Dades que l’ICAEN no publica pero que si ens han facilitat. Resulta curiós que estiguin publicades a nivell municipal les dades de generació d’energia (un fenomen intranscendent dins el sector energètic actualment), però no les de consum energètic, molt més importants i transcendents des de tots els punts de vista. Quedi clar, en tot, cas, que l’ICAEN aquí fa una feina impagable i voluntària, i que supleix la feina de producció d’estadística energètica exhaustiva que entenem haurien de fer altres organismes competents, com el Ministerio de Energia o la Comisión Nacional de la Energia.

El que es podria aconseguir?

Sembla que els procediments de intercanvi de dades entre les administracions i les companyies són poc eficients, almenys quan pots trobar online  dades agregades de consum elèctric en tems real, a nivell de tot Espanya. A la llum d’aquest magnífic gràfic (la font de dades mes objectiva sobre el seguiment de les vagues generals!) no és temerari assegurar que això mateix es podria fer perfectament a nivell d’altres agregats territorials, inclòs el nivell de municipi o, perquè no, d’estació o subestació transformadora. O d’edifici!.

Però mes que el temps real, als municipis els interessaria saber, segurament, el territori real: el consum, i les necessitats energètiques, dels seus barris, urbanitzacions, polígons industrials o, fins i tot, de illa cadastral. I la seva evolució en el temps. També podem assegurar –ja ens desmentireu als comentaris al post, si ens equivoquem– que això és perfectament possible tècnicament donat que totes les factures de consum estan associades a un be immoble amb una referència cadastral.

Una datacooperació  és possible. I convenient.

Les administracions i les empreses de serveis públics hauriem de ser capaces doncs de poder compartir microdades o, si mes no, dades altament desagregades, en benefici mutu i, per tant, en benefici del ciutadà, en el nostre cas, i del client, en el seu. Sempre respectant la protecció de dades personals i el secret estadístic, obviament.

Les administracions, incloses les petites com els ajuntaments, també tenim dades que a aquestes els poden interessar per a planificar millor les seves infrastructures, com és la dinàmica poblacional del padró continu d’habitants, la previsió d’habitatges, la radicació de noves activitats, etc.. Pero sols els municipis mes grans tenen sistemes de datawarehouses i, sobretot, capacitats tècniques per explotar-los, que facin això viable a la pràctica. :(

D’aquesta manera no hauríem de recórrer a complicats models estadístics, fets per grups de recerca universitaris, per a saber els consums energètic dels edificis de la nostra ciutat, com han fet molt recentment a Nova York:

Estimació estadística del consum energètic dels edificis de Nova York

Perquè hem d’estimar dades que en realitat ja existeixen? No és socialment més eficient treballar per poder accedir-hi? Perquè aquesta mania a tancar les dades als nostres sistemes i no compartir-les quan poden ser útils pel be general, per a millorar la governança de la societat i la qualitat de vida?.  Be, la resposta és evident, no siguem il·lusos: la informació és poder.  Però hem d’anar treballant, a roda del moviment de l’opendata, per a que això canviï. I no sols per les dades públiques!

Cas 2. Les dades del sistema de telecomunicacions.

Aquí la manca de dades és encara més greu. No es que no sapiguem els clients o els consums (de telefonia o de ample de banda en aquest cas) al nostre municipi sinó que no sabem ni les infraestructures instal·lades al nostre municipi.Per llogar-hi cadires!. Les teleoperadores no comparteixen on tenen posada la fibra òptica o quina infraestructura tenen instal·lada a les centraletes telefòniques, que són unes informacions rellevants per saber si el nostre municipi podrà entrar de ple a la societat de la informació o es quedarà a la societat dels rumors. On hi ha fibra òptica instal·lada és un secret d’Estat al que, curiosament, no hi té accés l’Estat.

Els ajuntaments sols tenim coneixement indirecte de les infraestructures de telecomunicacions que hi ha a la ciutat, fruit de les llicències que les teleoperadores necessiten per obrir el carrer. Però això sols en el cas de canalitzacions noves. I una cosa és saber que hi ha una canalització de  tal empresa i l’altra saber que hi passa per din i on connecta.

No disposem de informació ni del nombre d’abonats, ni del nombre de línies de banda ampla ni, tant sols, de fins quin punt disposem de infraestructures de fibra òptica. El que si sabem, positivament, es de les enormes carències en ample de banda fruit de les queixes dels clients, ajuntament inclòs.

Òbviament totes aquestes dades les teleoperadores les tenen, i sols han de donar-li a un parell de botons dels seus aplicatius informàtics de consulta sobre el datawarehouse corporatiu per a generar-les sobre un mapa, perfectament geoposicionades. Però simplement no hi ha voluntat de compartir-les.

Cas 3. Les dades del sistema financer.

Sembla evident que per a planificar els serveis socials i les polítiques de promoció econòmica tenir les dades de l’activitat financera al nostre municipi seria un input important ¿no?.  També hem intentat assabentar-nos de l’activitat credíticia al nostre municipi, contactant directament amb les entitats financeres per a saber els crèdits concedits a les empreses del municipi i la seva evolució. La resposta oficial es “no tenim aquesta dada”.  Ejem,..

Addenda.

Com creiem haver demostrat, les dades “sempre existeixen”, i son fàcilment municipalitzables. Tècnicament és ben fàcil fer les consultes als repositoris de dades, públics i privats, per a generar estadística per municipi i fins i tot per àrees més petites, inframunicipals. Si això no es fa, a la pràctica és, en primer lloc, per desconeixement d’aquestes possibilitats dels qui poden decidir sobre aquestes dades. I en segon lloc, per manca de voluntat del propietari de les dades de compartir-les i obrir-les.

En el cas tractat aquí, les dades de les empreses privades de concessió pública, s’adduirà que es un secret de negoci, informació confidencial a preservar als ulls de la competència. Però els reguladors haurien de saber que la desitjada (i no aconseguida) competència sols és possible si el mercat és transparent. Si no ho saben no hauríen de ser reguladors. I, més enllà d’aquesta ensenyança de primer curs a qualsevol facultat d’econòmiques, l’interès públic (la planificació ordenada del territori, dels servies..) hauria de prevaldre sobre l’interès privat (el benefici).

Josep Vives, Observatori de la Ciutat de l’Ajuntament de Rubí


Mostra continua de vides laborals 2010

11 novembre 2011

Fa gairebé un any ja vaig parlar de la Mostra Continua de Vides Laborals (MCVL) i de la seva aplicabilitat als municipis de més 40.000 habitants en el post Mostra contínua de vides laborals (MCVL): l’ús a nivell local.

En aquell post, com exemple de la utilitat de la MCVL, presentava l’evolució dia a dia, durant el 2009, dels treballadors assalariats en alta laboral que cotitzaven al règim general de la Seguretat Social per als municipis més grans de la província de Barcelona, i també del conjunt de la província de Barcelona. Aquell gràfic permetia veure el comportament estacional per part de les empreses a l’hora de contractar personal i en l’acomiadament o finalitzacions de contractes, com és el cas, per exemple, de l’inici o la finalització del curs escolar, etcètera (gràfic dinàmic).

En aquest post continuaré analitzant dades extretes de la MCVL del 2010 sense dades fiscals per a Mataró, fent tres petits treballs estadístics. El primer treball consisteix en calcular l’error d’aquesta mostra a nivell municipal; el segon, és comprovar si la mostra presenta un bon ajustament en la seva distribució per seccions econòmiques; i la tercera, és comprovar si la xifra d’assalariats del darrer dia del mes és una “bona mesura” del que ha passat durant el mes.

Comencem. En primer lloc abans de calcular l’error mostral, cal explicar que és. Així l’error mostral és la divergència que hi ha entre l’estadístic obtingut a través de la mostra i el corresponent paràmetre de la població. Així, de la MCVL-2010, el nombre de treballadors assalariats mostrejats que cotitzen al règim general en centres de cotització ubicats a Mataró, en data 31 de març del 2010, és de 1.219, xifra que representa el 4,13% del total de cotitzants que dóna el Departament d’Empresa i Ocupació per aquesta mateixa data (29.506 assalariats). Fixant un nivell de confiança del 95,5%, l’error màxim d’aquesta mostra és del 2,81%. Es tracta doncs d’un nivell d’error més que assumible, ja que habitualment s’utilitzen errors del 5% o inferiors. Si voleu calcular l’error, ho podeu fer accedint a aquest full de càlcul fent clic a sobre l’imatge.

El segon treball té com a objectiu comprovar si la distribució dels assalariats que cotitzen al règim general de la Seguretat Social per seccions econòmiques de la MCVL-2010, s’ajusta a la distribució que trimestralment proporciona el Departament d’Empresa i Ocupació (enllaç). Per fer aquesta comprovació utilitzo la prova no paramètrica Chi-quadrat de bondat d’ajust. Aquesta prova l’ aplico als assalariats que treballen a Mataró per als quatre trimestres del 2010. La hipòtesi nul·la d’aquest contrast és la següent: la istribució de la mostra s’ajusta a la de la població (nota: s’han agrupat algunes seccions econòmiques, ja que els valors esperats estaven per sota de 5).

La prova s’ha dut a terme amb el paquet estadístic de software lliure R, i el resultat que s’obté és el següent:

                             p-valor

31 de març             0.9841054

30 de juny              0.9707055

30 de setembre    0.9872099

31 de desembre    0.9434755

Amb aquests p-valors no es pot rebutjar la hipòtesi nul·la que la distribució per seccions econòmiques de la mostra dels assalariats que treballen en centres de cotització ubicats a Mataró s’ajusti a la distribució poblacional per als quatre dies seleccionats.

 La sintaxi d’R per dur a terme el trobareu en el següent fitxer: Sintaxi bondat ajust.

El darrer treball que duré a terme té com objectiu comprovar si la data en què s’ofereix informació sobre el total de cotitzants en alta laboral al règim de la Seguretat Social explica adequadament el volum d’assalariats que hi ha hagut durant el mes. Però que vol dir “explicar adequadament”? En aquest cas he optat per utilitzar la mitjana diària d’assalariats de cada mes, si bé una altra possibilitat seria utilitzar la mediana.

Per tant la hipòtesi nul·la a contrastar diu el següent: la mitjana diària d’assalariats de cada mes és igual a la xifra del darrer dia. Per dur a terme aquest contrasta utilitzo una prova no paramètrica –com en el cas de la prova de bondad d’ajust– donat que la distribució de la dades no s’ajusta a la d’una normal, tal i com s’observa a través dels dotze histogrames corresponents als dotze mesos.

Per tant, la no normalitat en la distribució diària de cada mes dels assalariats, fa que la prova a realitzar per contrastar la hipòtesi nul·la plantejada anteriorment sigui la prova de Wilcoxon, i els resultats d’aquesta prova per cada mes del 2010 a Mataró són els següents:

Només en els mesos de setembre i d’octubre, el p-valor de la prova de Wilcoxon aconsegueix un valor clarament superior al 5%, i per tant no es pot rebutjar la hipòtesi nul·la, que diu que la mitjana d’assalariats del mes és igual a la dada del darrer dia del mes. Si observem l’interval de confiança de la prova de Wilcoxon per als mesos de setembre i octubre, s’observa com la xifra d’assalariats del darrer dia dels mesos respectius, es troben dins de l’interval de confiança.

En la resta de mesos el p-valor es troba per sota del 5%, fet que no permet acceptar la hipòtesi nul·la, i per tant se’n desprèn que la xifra d’assalariats del darrer dia és diferent de la mitjana mensual. Com es pot veure en la taula, en set mesos, la xifra d’assalariats del darrer dia del mes es troba per sobre de la mitjana mensual d’assalariats, mentre que en només tres mesos està per sota de la mitjana. Aquests, són els resultats per a Mataró. Si voleu replicar la prova en el següent enllaç hi trobareu la sintaxi d’R: Sintaxi Wilcoxon.

La MCVL és un mostra pensada per fer investigacions a nivell estatal o autonòmic, i el fet de posar a l’abast una mostra tan gran (per sobre del milió de persones) i amb tantes variables (més de 100 variables) permet fer-hi anàlisis per a col·lectius minoritaris. Però els municipis de més de 40.000 habitants també la podem aprofitar per extreure’n dades del nostre municipi. Val a dir, però, que per als observatoris municipals explotar la ingent quantitat d’informació que hi ha en aquesta base dades no és fàcil ja que d’entrada requereix disposar de maquinari i programari adequat per explotar una base de dades amb més de 14 milions de registres (que corresponen a més d’un milió de persones), però segurament el més important és que es necessari dedicar-hi un temps important per conèixer la base de dades. Crec, sincerament, que val la pena dedicar-hi temps a conèixer i explotar aquesta base de dades, ja que, fins al moment, és l’única eina gratuïta –l’únic cost seria el temps que hi dediqui el tècnic– que permet conèixer més a fons una part important del mercat de treball local.

Gerard Reverté Calvet

Servei d’Estudis i Planficació

Ajuntament de Mataró


Follow

Get every new post delivered to your Inbox.

Join 676 other followers

%d bloggers like this: