Big Data, Open Data i informació pública

7 gener 2017

En una sessió formativa recent que tenia per finalitat donar a conèixer el projecte d’implantació del nou sistema integrat d’informació estadística de Catalunya (SIIE) [1], el director de l’Idescat avançava que, a banda de treballar en l’arquitectura d’un nou servidor força més funcional amb les dades generades a partir dels diferents registres administratius (censos, padrons, enquestes i estimacions,… públics), s’estava sospesant la possibilitat d’incorporar al sistema informació estadístiques originàries de fonts privades, tals com bancs, asseguradores, empreses subministradores, empreses de telecomunicacions o grans companyies comercials, etc, com ja ho estaven fent altres instituts d’estadística públics de l’Estat.

El Gran Iceberg de la informació estratègica, a OESST, “Dades: la teva caixa d’eines. L’ús estratègic de la informació per millorar la gestió pública”, conferència a la sèrie Reptes de l’Ajuntament de Terrassa en l’aprenentatge organitzatiu, 25 feb 2014.

El Gran Iceberg de la informació estratègica, a OESST, “Dades: la teva caixa d’eines. L’ús estratègic de la informació per millorar la gestió pública”, conferència a la sèrie Reptes de l’Ajuntament de Terrassa en l’aprenentatge organitzatiu, Terrassa, 25 feb 2014.

Llegeix la resta d’aquesta entrada »


Les trajectòries dels residents a Mataró a través de la Mostra Contínua de Vides Laborals

28 Novembre 2014

Ja fa més de dos anys que no parlàvem de la Mostra Contínua de Vides Laborals (MCVL) i de la seva aplicació a nivell local. Durant en aquests més de dos anys l’Idescat ha començat a publicar informació de la MCVL a nivell local (aquí), però vull recordar que des del Servei d’Estudis de l’Ajuntament de Mataró venim publicant dades de la MCVL (principalment per l’àmbit del nostre municipi) des del 2010 (aquí), si bé es cert que no ho venim fent de forma regular.

El motiu d’aquesta manca de regularitat en l’explotació de la MCVL és ben senzill; per una administració local, emprendre l’anàlisi d’una base de dades tan gran (més de 9 GB de dades, 5 taules que ocupen 22 fitxers, i més de 20 milions de registres) i tan complicada (més de 130 variables) resulta una tasca titànica, ja que per tal d’analitzar les dades és requereix d’ordinadors prou potents, es requereix de personal amb coneixements de programació i es requereix de temps. Afortunadament per a l’Ajuntament de Mataró la contractació d’un pla d’ocupació, Antoni Braza, amb formació estadística i coneixements avançats de programació ens està permetent afrontar l’estudi de la MCVL de l’any 2013, tant amb l’onada sense dades fiscals com amb dades fiscals.

L’objectiu d’aquesta entrada no és tant veure les trajectòries laborals dels mataronins, com d’una banda insistir en l’ús de la MCVL per analitzar més a fons la situació laboral a nivell local (dels municipis de més de 40.000 habitants), i per altra banda mostrar el paquet TraMineR que permet fer gràfics de les trajectòries d’individus. Llegeix la resta d’aquesta entrada »


El sistema de localització territorial municipal de l’Ajuntament de Girona: La Base de Referència Territorial

2 Mai 2014

El territori, a banda de premetre’ns localitzar fets o esdeveniments, ens serveix de referència única i ens permet coordinar diferents bases de dades que, a l’Ajuntament de Girona, es gestionen per separat des de diferents àrees.

Des d’aquí la Unitat d’Anàlisi Territorial (UMAT) es gestiona la Base de Referència Territorial (BRT en endavant) de l’Ajuntament: és el sistema de geocodificació, és a dir l’estructura de codificació del territori per tal de poder localitzar correctament qualsevol lloc o esdeveniment que ocorri a la ciutat. La gestió de la BRT inclou tant el manteniment cartogràfic com alfanumèric i va des del límit municipal fins als locals, passant per carrers i edificis entre d’altres. Per tant, aquesta base que descriu el territori, tant gràficament com en codi, és la ròtula de tot el sistema a partir del qual és possible la coordinació del conjunt d’informació corporativa.

Dins d’aquesta BRT, hi té un pes molt important el Cens d’Edificis i Locals de la Ciutat. El Cens descriu tots els edificis i locals, amb indicació de la seva adreça completa (carrer, número, escala pis i porta) i informació addicional com referència cadastral sobre la qual es troba l’edifici, l’ús o les delimitacions administratives a les quals pertany (Àrea Bàsica de Salut que li correspon, zones escolars, zones policials etc.)

Aquesta base es nodreix bàsicament a partir del control de les llicències d’obres i dels expedients cadastrals: s’incorporen els enderrocs, nous edificis, rehabilitacions i altes i modificacions cadastrals.

Aquest cens, doncs, és el continent on s’hi pot ubicar els diferents fets que ocorren a la ciutat, a partir de la seva adreça: el lloc on un persona s’empadrona, el lloc on es dóna d’alta una activitat, el lloc on es dóna una llicència d’obres… ja que la majoria d’aquests fets tenen lloc en una edificació o solar urbanitzable (ja sigui de la zona urbana o de la rústica).imatge 2

Llegeix la resta d’aquesta entrada »


Una foto de la població en relació a l’activitat

26 Abril 2014

Fer una foto fixa i freqüent de la distribució de la població en relació amb l’activitat a escala local, esdevé un exercici que ha d’anar més enllà dels registres estadístics.

Amb una freqüència molt baixa aquesta instantània ens l’aporten els Censos de Població i per una anàlisi territorial superior una aproximació interessant és la que fa l’Observatori d’Empresa i Ocupació de la Generalitat de Catalunya. En el seu Butlletí de fluxos del mercat de treball, en el cas de Catalunya (4t trimestre 2013) analitza els moviments registrats entre dos períodes pel que fa a la situació laboral dels treballadors: inactivitat, ocupació i atur.

Tornant a escala municipal, a partir de registres administratius i estimacions es pot fer una foto aproximada per 2013 de la distribució de la població en relació a l’activitat. Ja avancem que és una foto moguda, per diversos motius.

Quadre sinòptic Llegeix la resta d’aquesta entrada »


Estimem molt la taxa d’atur

28 Octubre 2013

Obtenir la taxa d’atur que sigui aplicable a escala local, actualitzable amb freqüència, comparable interterritorialment i que sigui un mètode barat, exclou les metodologies que inclouen una enquesta. Calcular-la a escala local és una quimera sobre la que s’ha anat fent progressos i aproximacions a partir de fonts d’informació registrals.

Ens queden els registres administratius on es puguin recollir variables assimilables a la població aturada i la població ocupada.

1 EPA

Aquest post és un breu exercici de comparació de dos mètodes, aplicats com a exemple a una comarca i un municipi. També s’apliquen a Catalunya per a poder posar-ho en relació als resultats de l’EPA. A partir d’aquest exercici és pot concloure que:

– Els nivells d’atur són força diferents entre funció de la metodologia utilitzada: EPA, Taxes d’Activitat i Afiliació.

– Les fluctuacions són més altes en el cas de l’EPA (l’atur es copsa mitjançant enquesta).

– La posició relativa de cada territori es manté comparant els mètodes aplicats a escala local: les taxes fluctuen de forma semblant.

– La taxa d’atur del municipi estaria aproximadament un punt percentual per sobre la de Catalunya, i unes dècimes de punt per sota la taxa de la comarca.

La tendència d’evolució ha estat similar en els tres territoris, mantenint-se les diferències entre els mateixos. S’ha produït augment de l’atur de juny de 2012 a març de 2013 i disminució de març a juny en 2013. Això darrer ja havia succeït de març a juny de 2012. No s’inclouen les taxes de setembre 2013 atès que pel càlcul d’una d’elles calen dades d’afiliació, no publicades a dia d’avui.

En definitiva una opció seria, a l’hora d’estimar la taxa d’atur local, tenir en compte el diferencial (calculat amb un mètode consensuat) d’aquest àmbit territorial respecte Catalunya. Aleshores si el càlcul de la taxa d’atur més reconegut i estès és el que proporciona l’Enquesta de Població Activa (EPA), a nivell local es podria aplicar el diferencial estimat respecte la taxa catalana que mostra l’EPA.

Llegeix la resta d’aquesta entrada »


Entenent les dades del mercat de treball

6 Setembre 2013

Les dades d’atur registrat del mes d’agost aparegudes aquesta setmana conviden, segons el Govern espanyol i segons alguns mitjans de comunicació, a l’optimisme. Per contra, els partits de l’oposició i diversos mitjans de comunicació creuen que les dades d’atur registrat, tot i no ser dolentes, si es combinen amb la pèrdua d’aproximadament 99.000 afiliats en alta laboral a la Seguretat Social, deixa la situació del mercat de treball espanyol tal i com estava, és a dir, a la UVI; en aquest sentit vaig llegir un comentari que va aparèixer en El País en referència a l’article “Evolución del mercado de trabajo” que deia, entre altres coses, el següent: “¿Cómo se come eso de que disminuya el paro y simultáneamente perdamos cientos de miles de afiliados a la SS.? …

Tot plegat m’ha fet reflexionar sobre la dificultat d’entendre les xifres del “mercat de treball”. L’objectiu –segurament agosarat– que m’he marcat en aquest post és intentar explicar de la forma més senzilla possible com “funcionen” els fluxos dels registres del mercat de treball espanyol.

Per explicar els fluxos presento el següent gràfic. El primer que vull apuntar és que aquest gràfic és una simplificació del sistema del mercat de treball, i que en cap cas la mida dels rectangles que apareixen en el gràfic representen el volum de població que hi ha en cada variable, ja que únicament s’intenta representar quines variables estan contingudes en altres variables.

Sistema simplificat del mercat de treball

Llegeix la resta d’aquesta entrada »


El Cadastre com a font periòdica de dades urbanes (II)

28 Juny 2013

En l’anterior post és va explicar quina informació conté l’arxiu 11 que es pot descarregar del Cadastre. A continuació s’explicarà la informació que conté la resta d’arxius que es poden descarregar del Cadastre: els arxius 13, 14, 15, 16 i 17.

• L’arxiu 13 conté els registres d’unitats constructives per cada parcel·la cadastral. En línies generals el concepte d’unitat constructiva coincideix amb el d’edifici, tot i que es poden admetre configuracions diferents a l’haver-hi en el mateix edifici diferents unitats constructives si aquest s’ha realitzat en diferents fases de construcció, o si presenta estats de conservació o zones de valors-trams de ponència diferents. A més, cada unitat constructiva potser urbana o rústica, segons la naturalesa del sòl ocupat (i l’any de la ponència). Llegeix la resta d’aquesta entrada »


El Cadastre com a font periòdica de dades urbanes (I)

26 Juny 2013

Presentació

En la “I Jornada de Govern Obert de Terrassa” que va tenir lloc el proppassat dia 20 de juny, en el torn de preguntes de la “Taula de debat sobre Open Data: realment s’estan obrint les dades per a ser reutilitzades?” es va comentar que el Cadastre espanyol és un dels millors del món en quant a l’obertura de dades que ofereix, afirmació amb la qual hi van estar d’acord els quatre components de la taula de debat; de la mateixa manera també és va posar el Registre Mercantil com exemple de que no és obertura de dades.

Durant els següents dos posts –el que es publica avui i el que sortirà divendres vinent– el Sr. Antoni Peiret de l’empresa Cylstat, ens donarà una visió general de les possibilitats que ens ofereix l’accés a les dades cadastrals, tant alfanumèriques com cartogràfiques, que es poden obtenir des del Web del Cadastre Virtual.

La possibilitat de disposar d’una informació que s’actualitza els mesos de febrer, juny i octubre, sobre dades relatives a finques, unitats constructives, construccions, immobles, elements comuns o conreus, és d’un gran interès per analitzar l’estructura de les nostres ciutats i els seus entorns periurbans. Més encara si es tracta de dades que es poden creuar amb altres variables. La gran varietat de dades i la seva complexitat, ha fet que s’hagi hagut de publicar en dos posts, per tal de poder donar una mínima visió que inciti a endinsar-nos en aquesta urb de dades que ofereix el Cadastre. Llegeix la resta d’aquesta entrada »


Els notaris digitalitzen les seves dades

14 Setembre 2012

Des de fa poques setmanes comptem amb una nova font estadística provinent de la informació de la que disposen els notaris de l’Estat espanyol. La informació que apareix en la seva base estadística és molt àmplia i extensa, i obre un gran ventall de possibilitats i dades que poden ajudar a entendre i anticipar comportaments de les persones, abastant, de moment, des de gener de 2007 fins el mes de març de 2012. I és que, tal i com informen a la seva Web, es tracta de la posada en disposició de la societat de prop d’un milió de series estadístiques, procedents d’escriptures públiques i altres documents notarials. Gràcies a aquesta informació, a partir d’ara podem tractar dades fiables del que les persones paguen pels seus habitatges (hipoteques), el preu de taxació de les mateixes, així com informació sobre donacions, testaments, o dissolucions de societats conjugals.

Tot i la gran feina realitzada, per tal d’informatitzar i obrir aquest ingent volum d’informació, s’ha d’apuntar en la part del “Debe” la falta de desagregació en molts dels grups i sèries estadístiques, que es queden en un nivell autonòmic o provincial, sense arribar al terme local. I és que, malgrat que sí que hi ha sèries on la desagregació arriba fins el municipi, no hi surten tots i només apareixen alguns municipis. Per als municipis que integren el Perfil de la Ciutat, en el cas de les compra-vendes d’habitatges, per exemple, hem trobat dades per als municipis de Girona, Lleida, Mataró, Sabadell, Santa Coloma i Terrassa, i, en canvi, no apareix informació per a la resta de municipis del Perfil, entre els que hi ha alguns amb un volum poblacional elevat (Manresa, Rubí, Vilanova i la Geltrú o Granollers, que superen els 60 mil habitants). Considerem que aquesta informació, així com tota la restant, és susceptible de ser tractada a nivell local ja que en totes les actes notarials figura la localitat en la que s’està procedint a realitzar la signatura del document, i que per tant és un aspecte clarament a millorar.

Però com la nostra manera de fer i sentir és optimista, ens aturarem a analitzar i veure les grans possibilitats que des de ja ofereix el Centro de Información Estadística del Notariado. La base de dades es distribueix a través de 20 grans grups d’informació, que a l’hora aglutinen al voltant de 300 subgrups de sèries estadístiques. La informació, com s’apuntava a l’inici, tracta aspectes com actes d’ordre familiar i personal, contractes per raó de matrimoni i actes relatius a unions o separacions de dret, contractes d’arrendament i cessions d’ús, actes urbanístics o crèdits, préstecs i garanties hipotecàries per citar alguns exemples.

Per posar un exemple de la importància de disposar de dades a nivell municipal, agafem les sèries de compra-venda d’habitatge i de la quantia monetària de les hipoteques consignades amb les entitats bancàries. En el primer dels casos, podem obtenir la informació a nivell local (tot i que no apareixen tots els municipis) i d’aquesta forma observar l’evolució d’aquest indicador. En canvi, per al cas de la quantia de les hipoteques només disposem de la informació a nivell provincial, fet que ens impossibilita comprovar la incidència directa en cada ciutat del preu sobre el número de les transaccions.

Taula 1

Taula 2

Tal i com està presentada la informació, podem arribar a intuir, sense poder fer un anàlisi complet al tractar-se d’àmbits territorials diferents, que el preu no és el factor més determinant perquè es venguin habitatges en els municipis que apareixen en la Taula 1, i que són els aspectes de finançament, mercat laboral o perspectives econòmiques els que afecten més al sector immobiliari, ja que tal i com es veu, una baixada dels preus efectius (a nivell provincial) de venda no afavoreixen el número final de transaccions (a nivell municipal).

És per aquest motiu pel qual des d’aquest humil canal, a més de felicitar al col·lectiu de notaris, volem animar-los a seguir amb aquesta bona feina i aprofundir en la desagregació de les dades, per tal d’ajudar a analitzar la realitat de la societat amb objectivitat i precisió.

Observatori Socioeconòmic de Grameimpuls, SA – Ajuntament de Santa Coloma de Gramenet


Padrons municipals i microestadística (III): el cadastre, primera part

9 Setembre 2012

Aquest article es una continuació dels altres dos anteriors, a aquest mateix bloc, sobre la microestadistica de base municipal basada en registres administratius. El primer situava un xic el context actual i les (enormes) possibilitats de fer microestadística als municipis a partir de les bases de dades de padrons fiscals, urbanístics i poblacionals. Al segon fèiem un repàs de les possibilitats tècniques insospitades que dona el padró més conegut de tots, per ser usat i difòs per l’estadística oficial, el padró continu d’habitants.

Tot i ser conscients de que les bases de dades registres administratius a vegades poden ser gigo (‘garbage in garbage out’) — com brillantment explicava el company de l’Observatori de Manresa en aquest mateix bloc–, aquí farem una introducció a una que sembla prou fiable per a extreure’n microestadística fiable. Ja se sap que els resgitres administratius mes fiables són els que tenen motivació fiscal, i els bens immobles (l’objecte del mòn real que registra el cadastre) són la base de molts impostos centrals a l’estructura de qualsevol estat modern i de la propietat privada. No sols de l’IBI, impost local motiu inicial per al que es va crear el cadastre, si no també per a altres impostos estatals com l’IRPF, l’Impost de Societats, l’Impost de Transmissions, etc.

La referència cadastral, el ID que identifica de forma unívoca cada parcel·la de propietat (polígon de sòl de la mateixa proietat i drets reals) i cada construcció en ella enclavada (bens literalment immòbils, que és d’on be la etimologia de be immoble) és,  junt amb el DNI, l’ID de les persones físiques, les claus relacionals (identificadors digitals) que estructuren (relacionen) totes les dades (en sentit de registre informàtic) de les persones, propietats i drets  de les que disposen les administracions. Són la nineta dels ulls del Big Brother del s.XX. Al s.XXI hem d’afegir una tercera ID per al mòn digital: el binomi adreça de e-mail/IP.

Aquì sola volem fer avinent les possibilitats estadístiques i d’extracció de coneixement sobre la ciutat (de fet sobre tot el terme municipal, tant el rural com el urbà) que té el cadastre, una base de dades complexa i integrada amb dos components d’informació codificats i, per tant, tractables matemàticament: la part gràfica (informació gràfica vectorial i georeferenciada) i la part alfanumèrica. I completament homogeneitzada a nivell de l’Estat, per a tots els municipis, grans o petits.

Les possibilitats analítiques de la part gràfica ja l’hem apuntat en un altre article anterior sobre el SIG aplicat. Precisament les capes gràfiques de bens immobles del cadastre son una de les bases cartogràfiques, juntament amb les bases topogràfiques dels instituts cartogràfics oficials, sobre la que s’estructura tota la informació gràfica georeferenciada dels ajuntaments.

Ara volem apuntar aquí la riquesa de les dades que emmagatzema la part alfanumèrica associada a cada referència cadastral. Moltes més de les que podem suposar des de fora. ¿quines realitats socials,  econòmiques i territorials podem estudiar a partir de la base de dades del cadastre estrictament?. A tall d’exemple:

  • estructura i evolució de la propietat
  • estructura i evolució de la urbanització del terreny
  • evolució de la urbanització del terreny i de la forma de edificar-hi al llarg dels anys
  • estructura i evolució dels usos dels terrenys rurals
  • evolució i estructura dels usos econòmics de les edificacions: residencials, industrials, comercials, equipaments públics…
  • evolució i estructura del mercat immobiliari (els canvis de propietat també acaben reflexant-se al cadastre)

Evolució?. Efectivament, el cadastre, de forma similar a com deiem en el cas del padró continu d’habitants,  emmagatzema l’històric fiscal i de propietat del be immoble: any de construcció, any d’adquisició dels drets de propietat sobre el be (per compravenda, successió o altres formes de transmissió de drets reals), historic de rebuts del padró de l’IBI d’aquell be/propietari, etc..

Aquí convé aclarir que el cadastre és molt més que el Padró de l’IBI, que no és més que els rebuts generats a partir de la situació cadastral de propietat del be immoble a 1 de gener de cada any. Així doncs, la base de dades de l’IBI NO es la base de dades del cadastre, sino un subconjunt de la informació de la segona per a generar una obligació fiscal determinada. En la definició de l’arxiu informàtic d’intercanvi entre entitats locals i les Direccions Provincials del Catastro es pot tenir una idea mes acurada de les dades que conté l’IBI.

Això vol dir que molta informació analíticament interessant potser sols està als sistemes informàtics de la Direccion General del Catastro, als que es pot tenir accès privilegiat, des dels municipis, gràcies als magnífics serveis de la Oficina Virtual del Catastro.

De fet, la DG del Catastro obra molt la informació de les seves bases de dades no sols a les entitats amb les que intercanvia dades, les entidades col·laboradoras (ajuntaments, notaris i registradors de la propietat), si no a tots els ciutadans, tant per a consultes puntuals d’un be immoble com per a consultes massives de centenars o milers de bens immobles.

Be, per anar obrint una mica l’interès per les dades cadastrals per avui ja n’hi ha prou. En una segona part d’aquest article (i IV de la sèrie de padrons i microestadistica) entrarem una mica mes al detall de les dades concretes: camps (variables), codis (categories) i estadístiques publicades que hi ha al cadastre. I en exemples d’explotacions analítiques concretes, quelcom que tot just fa un lustre que s’ha començat a fer i potenciar.

Precisament, just ara ens trobem en procès de documentació i revisió bibliogràfica sobre la base de dades del cadastre i de tots els complexes conceptes (legals la majoria) que representen les seves dades….

I s’ha de començar pel principi dels principis: la Ley del Catastro!

Per cert, el cadastre ens parla de totxos i cases, de impostos o de drets de propietat?. Doncs més del segon que del primer, segur!. I un sociòleg, com un servidor, es fa creus de com a través de l’explotació adhoc i a fons del cadastre –si ens deixen entrar als seus sistemes informàtics, clar–, es podria rastrejar la transformació del model de societat a partir del repartiment de la propietat. La propietat és l’eix a partir del que es vertebren les societats capitalistes, les desigualtats, el poder, etc… I de fet de le societats no capitalistes tambe!. I la propietat està registrada i documentada des del temps dels romans. Pero ara està registrada en potentíssimes bases de dades fàcilment interrogables.  😉

De fet, aquest és una línia de recerca (no iniciada fins on un servidor coneix) que proposem a la comunitat acadèmica investigadora i a la Direccion General del Catastro. I em quedo tant ample…

😉

Josep Vives (Observatori de la Ciutat, Ajuntament de Rubí)


%d bloggers like this: