Padrons municipals i microestadística (III): el cadastre, primera part

9 setembre 2012

Aquest article es una continuació dels altres dos anteriors, a aquest mateix bloc, sobre la microestadistica de base municipal basada en registres administratius. El primer situava un xic el context actual i les (enormes) possibilitats de fer microestadística als municipis a partir de les bases de dades de padrons fiscals, urbanístics i poblacionals. Al segon fèiem un repàs de les possibilitats tècniques insospitades que dona el padró més conegut de tots, per ser usat i difòs per l’estadística oficial, el padró continu d’habitants.

Tot i ser conscients de que les bases de dades registres administratius a vegades poden ser gigo (‘garbage in garbage out’) — com brillantment explicava el company de l’Observatori de Manresa en aquest mateix bloc–, aquí farem una introducció a una que sembla prou fiable per a extreure’n microestadística fiable. Ja se sap que els resgitres administratius mes fiables són els que tenen motivació fiscal, i els bens immobles (l’objecte del mòn real que registra el cadastre) són la base de molts impostos centrals a l’estructura de qualsevol estat modern i de la propietat privada. No sols de l’IBI, impost local motiu inicial per al que es va crear el cadastre, si no també per a altres impostos estatals com l’IRPF, l’Impost de Societats, l’Impost de Transmissions, etc.

La referència cadastral, el ID que identifica de forma unívoca cada parcel·la de propietat (polígon de sòl de la mateixa proietat i drets reals) i cada construcció en ella enclavada (bens literalment immòbils, que és d’on be la etimologia de be immoble) és,  junt amb el DNI, l’ID de les persones físiques, les claus relacionals (identificadors digitals) que estructuren (relacionen) totes les dades (en sentit de registre informàtic) de les persones, propietats i drets  de les que disposen les administracions. Són la nineta dels ulls del Big Brother del s.XX. Al s.XXI hem d’afegir una tercera ID per al mòn digital: el binomi adreça de e-mail/IP.

Aquì sola volem fer avinent les possibilitats estadístiques i d’extracció de coneixement sobre la ciutat (de fet sobre tot el terme municipal, tant el rural com el urbà) que té el cadastre, una base de dades complexa i integrada amb dos components d’informació codificats i, per tant, tractables matemàticament: la part gràfica (informació gràfica vectorial i georeferenciada) i la part alfanumèrica. I completament homogeneitzada a nivell de l’Estat, per a tots els municipis, grans o petits.

Les possibilitats analítiques de la part gràfica ja l’hem apuntat en un altre article anterior sobre el SIG aplicat. Precisament les capes gràfiques de bens immobles del cadastre son una de les bases cartogràfiques, juntament amb les bases topogràfiques dels instituts cartogràfics oficials, sobre la que s’estructura tota la informació gràfica georeferenciada dels ajuntaments.

Ara volem apuntar aquí la riquesa de les dades que emmagatzema la part alfanumèrica associada a cada referència cadastral. Moltes més de les que podem suposar des de fora. ¿quines realitats socials,  econòmiques i territorials podem estudiar a partir de la base de dades del cadastre estrictament?. A tall d’exemple:

  • estructura i evolució de la propietat
  • estructura i evolució de la urbanització del terreny
  • evolució de la urbanització del terreny i de la forma de edificar-hi al llarg dels anys
  • estructura i evolució dels usos dels terrenys rurals
  • evolució i estructura dels usos econòmics de les edificacions: residencials, industrials, comercials, equipaments públics…
  • evolució i estructura del mercat immobiliari (els canvis de propietat també acaben reflexant-se al cadastre)

Evolució?. Efectivament, el cadastre, de forma similar a com deiem en el cas del padró continu d’habitants,  emmagatzema l’històric fiscal i de propietat del be immoble: any de construcció, any d’adquisició dels drets de propietat sobre el be (per compravenda, successió o altres formes de transmissió de drets reals), historic de rebuts del padró de l’IBI d’aquell be/propietari, etc..

Aquí convé aclarir que el cadastre és molt més que el Padró de l’IBI, que no és més que els rebuts generats a partir de la situació cadastral de propietat del be immoble a 1 de gener de cada any. Així doncs, la base de dades de l’IBI NO es la base de dades del cadastre, sino un subconjunt de la informació de la segona per a generar una obligació fiscal determinada. En la definició de l’arxiu informàtic d’intercanvi entre entitats locals i les Direccions Provincials del Catastro es pot tenir una idea mes acurada de les dades que conté l’IBI.

Això vol dir que molta informació analíticament interessant potser sols està als sistemes informàtics de la Direccion General del Catastro, als que es pot tenir accès privilegiat, des dels municipis, gràcies als magnífics serveis de la Oficina Virtual del Catastro.

De fet, la DG del Catastro obra molt la informació de les seves bases de dades no sols a les entitats amb les que intercanvia dades, les entidades col·laboradoras (ajuntaments, notaris i registradors de la propietat), si no a tots els ciutadans, tant per a consultes puntuals d’un be immoble com per a consultes massives de centenars o milers de bens immobles.

Be, per anar obrint una mica l’interès per les dades cadastrals per avui ja n’hi ha prou. En una segona part d’aquest article (i IV de la sèrie de padrons i microestadistica) entrarem una mica mes al detall de les dades concretes: camps (variables), codis (categories) i estadístiques publicades que hi ha al cadastre. I en exemples d’explotacions analítiques concretes, quelcom que tot just fa un lustre que s’ha començat a fer i potenciar.

Precisament, just ara ens trobem en procès de documentació i revisió bibliogràfica sobre la base de dades del cadastre i de tots els complexes conceptes (legals la majoria) que representen les seves dades….

I s’ha de començar pel principi dels principis: la Ley del Catastro!

Per cert, el cadastre ens parla de totxos i cases, de impostos o de drets de propietat?. Doncs més del segon que del primer, segur!. I un sociòleg, com un servidor, es fa creus de com a través de l’explotació adhoc i a fons del cadastre –si ens deixen entrar als seus sistemes informàtics, clar–, es podria rastrejar la transformació del model de societat a partir del repartiment de la propietat. La propietat és l’eix a partir del que es vertebren les societats capitalistes, les desigualtats, el poder, etc… I de fet de le societats no capitalistes tambe!. I la propietat està registrada i documentada des del temps dels romans. Pero ara està registrada en potentíssimes bases de dades fàcilment interrogables.  ;)

De fet, aquest és una línia de recerca (no iniciada fins on un servidor coneix) que proposem a la comunitat acadèmica investigadora i a la Direccion General del Catastro. I em quedo tant ample…

;)

Josep Vives (Observatori de la Ciutat, Ajuntament de Rubí)


Padrons municipals i microestadística (II): el padró continu d’habitants

2 desembre 2011

Aquest article és una continuació del que varem publicar fa uns mesos, Padrons Municipals i Microestadística (I), i que  continuarem amb articles posteriors.

L’objectiu d’aquest article és donar a conèixer a la comunitat investigadora, als estudiosos, i als planificadors, la informació que “dorm” a les bases de dades dels padrons continus, així com el seu enorme potencial per a generar coneixement bàsic sobre la dinàmica demogràfica i territorial de les ciutats (i per elevació dels territoris supramunicpals). Coneixement pràctic per a planificar polítiques i gestionar projectes des de les administracions.

L’estadística oficial del padró continu.

Com tots els investigadors socials que no han treballat mai “dins” d’un ajuntament, o que hi han treballat però no han tingut ocasió de “tafanejar” les bases de dades de l’ajuntament “al costat” dels informàtics que les gestionen i les coneixen a fons, la meva idea de les estadístiques de població del padró continu que podíem analitzar era la que té tothom sobre la habitual i estàndard explotació estadística del padró continu.

L’INE/IDESCAT, a nivell d’estadística oficial, sols treu aprofitament estadístic de les següents variables: Sexe, Nacionalitat, Lloc de naixement, Data de naixement, Lloc de residència, Edat,  Relació entre Lloc de Residència i el Lloc de Naixement, a partir del que disposa el marc normatiu del padró continu.

L’estadística oficial es genera sols per aquestes 5 variables, amb escassos creuaments entre elles, a una sola data de tall anual (u de gener), i a una desagregació territorial màxima de secció censal, que vindria a ser unes quantes illes de cases, o moltes illes si són zones de baixa densitat (urbanitzacions, per exemple).

El padró continu, una base de dades relacional.

L’estadística sol generar-se a partir de taules planes: files (individus) per columnes (variables). Per entendre’ns, un full d’Excel o una taula d’Acces. Desgraciadament, la majoria dels que generem estadística no coneixem prou el mòn de les bbdd relacionals i dels sistemes gestors de bases de dades (SMDB)…

La base de dades informàtica del padró continu està gestionada per un DBMS (Oracle habitualment), amb la quasi infinita potència analítica que això suposa. El DBMS pot ser interrogat (queries en llenguatge informàtic), sobre qualsevol aspecte, filtre o condició que ens puguem imaginar. Qualsevol texte, codi o número d’una bbdd relacional pot usar-se com a condició, filtre o base de la pregunta que vulguem fer al sistema. Però en el seu llenguatge: l’SQL o derivats. Per fer doncs anàlisis més aprofundits caldrà treballar doncs amb l’administrador informàtic de la bbdd, que és qui en coneix l’estructura del model de dades (molt complexa) del padró continu i les possibilitats tècniques.

A banda de les 5 variables famoses, la base de dades registra i codifica tots els moviments o canvis en les dades dels empadronats: altes o baixes cap a altres municipis i països (migració intermunicipal), però també canvis de domicili dins del mateix municipi (migració intermunicipal). Un altre codi que es registra és la renovació padronal dels estrangers, obligatoria cada pocs anys des del 2005.

Mes enllà de l’estadística oficial…

L’estadística oficial és de peridocitat anual i de stock o tall a un dia concret (exceptuant el cas de les estadístiques de variacions residencials a partir del que es construeixen les dades de moviments migratoris)  i amb un retard en la publicació d’un any aproximadament. En canvi, l’actualització de les bases de dades del padró continu a nivell de l’ajuntament és pràcticament contínua. L’intercanvi i actualització de dades entre l’INE (que creua les dades dels municipis amb altres bases de dades) i els ajuntaments es fa de forma automatizada i mensual. La nostra experiència és que les dades ja són prou “solides” després de tres mesos de la data de tall, com a molt aviat, doncs s’han d’incorporar les dades que procedeixen del INE, i registres oficials (naixements, morts, etc).

Habitualment, ni a nivell acadèmic ni a nivell de les pròpies administracions, almenys pel que ens consta a nosaltres, no es solen fer explotacions “mes aprofundides” de les bases de dades del padró continu. Si més no, no es publiquen. Però tampoc es fan grans explotacions a nivell “intern”, per a necessitats de planificació o gestió, més enllà de representar les dades sobre el SIG corporatiu intern. Trobem algunes excepcions en algun ajuntament gran Barcelona o Mataró, casos que ens “mostren” la punta del iceberg de les enormes possibilitats analítiques d’aquesta bbdd. Al portal d’opendata de l’ajuntament podem veure un bon aprofitament estadístic de les dades del padró continu; els companys del Servei d’Estudis i Planificació de Mataró, integrants de la xarxa de la que aquest bloc n’és expressió, també fan una bona publicació anual a partir de l’explotació més aprofundida del padró continu.

Una base de dades amb memòria històrica. Anàlisis longitudinals?

Un fet poc coneguts pels investigadors,  i que és d’extrema importància, és que el padró continu es una bbdd que guarda l’històric dels seus registres!. És a dir, puc interrogar a la bbdd sobre la població actual, peró també sobre la població i totes les seves característiques a qualsevol data anterior. Avui, a finals del 2011 podem interrogar a la base de dades per a que ens reprodueixi la  “imatge stock” del dia 6 de Febrer del 2003, o un  “acumulat de moviments” (altes, baixes, migracions, naixements, morts, renovacions padronals d’estrangers) entre els dies 6 de Maig i 3 de Juliol del 2008). Obviament, cada registre-persona o registre-moviment amb totes les variables i codis associats a la persona o el moviment “en aquell moment”.

Tècnicament és possible fer estudis longitudinals de com canvien les persones, les llars, els assentament en les zones, els edificis, els pisos…. Increible!. Encara recordo quan vaig descobrir que la bbdd guardava tot l’historic de tots els canvis en les dades…, li vaig preguntar quatre vegades seguides al informàtic…. No m’ho creia!. Ara sé que si no es fa és o per desconeixment dels potencials interessats (investigadors, però  també els mateixos tècnics i planificadors municipals i de les altres administracions) o per la complexitat tècnica de l’extracció de la informació i el seu al cost en recursos humans dels departaments de informàtica (sempre sobrecarregats de feina). Cal treballar costat a costat amb l’informàtic administrador de la base de dades i el funcionari responsable del manteniment del padró, i millor que aquests tinguin experiencia llarga en el padró per controlar canvis que s’hagin produït en la manera de registrar les dades, en els codis determinats per l’INE o altres modifiacions tecnico-administratives que poden dificultar la interpretació correcta de les estadístiques produides.

Així doncs, la base de dades conté també tota la informació padronal de les persones que han viscut al municipi en un moment donat i i ja no hi viuen, per defunció o per canvi de residència. Ens permet viatjar cap el passat. La “historicitat” té però una limitació temporal: l’any en que es va iintroduir el padró a l’ajuntament en un DBMS comme il faut, en algun moment lleugerament posterior  al 1996 (inici del padró continu). En el cas de l’ajuntament de Rubí aquest moment va ser a mitjans del 1999. A Rubí podria retrocedir, posar la lupa a qualsevol moment de la darrera dècada, una dècada apassionant pels enormes canvis demogràfics i territorials.

Estudiar estructures de llars?.

Habitualment també es treballa l’estadística de número de persones empadronades al mateix be immoble (per exemple, per a detectar pisos patera). Però tècnicament pensem que seria possible analitzar les estructures de les llars a partir de la construcció de tipologies a partir del nombre de persones cohabitants, el seu sexe i edat. I també els canvis en aquestes estructures per canvis en el lloc d’empadronament dels seus components al llarg del temps, fet que no es pot fer en cap altra font estadística a nivell municipal, doncs els censos són dades de stock.

Una bona notícia: l’actualització de la variable nivell d’estudis.

Una de les variables obligatòries de la que  no se n’ha fet fins ara cap aprofitament estadístic a nivell d’estadística oficial  és el nivell d’estudis dels empadronats. Com figura al marc normatiu, és obligatori recollir el nivell d’estudis acreditat del veí. Peró els veïns no van a actualitzar les seves dades cada cop que adquireixen un nou nivell educatiu. Per tant, es una variable tremendament desactualitzada… fins ara. Segons explicacions del funcionari responsable del padró continu al meu municipi, des de finals del 2008 l’INE creua les dades del padró continu amb les dades del ministeri d’educació i, a partir d’aquí envia als ajuntaments les dades actualitzades. Caldrà doncs fer algunes explotacions per a veure el nivell i fiabilitat d’aquesta dada, que seria de gran interès per la seva correlació amb la classe social o l’estatus de les llars.

Una base de dades amb detall geogràfic il·limitat.

Com ja varem comentar al anterior post sobre microdades, almenys en els ajuntaments mitjans i grans, amb prouta infrastructura informàtica, l’identificador (ID) de la persona està associat informàticament al ID de la referència cadastral del be immoble en el que resideix. Com també hi estan relacionats el ID dels vehicles que paguen llicència en aquell municipi, o els IDsi de les transaccions fiscals d’aquella persona, i d’aquella llar (si acceptem l’equivalencia entre “llar” i persones residents al mateix “be immoble”) amb l’ajuntament.

L’associació entre el ID del habitant i el ID del be immoble fa que puguem combinar les dades del padró continu amb qualsevol capa de dades geogràfiques i fer-ne anàlisis creuats, com ja s’ha comentat en altres posts.

L’assoaciació entre dels dos elements anteriors amb objectes fiscals, particularment els cotxes de la llar/immoble, dels que es tenen totes les dades al padró de vehicles (model concret, potència, cavallatge), i que correlaciona fortament amb la classe social o l’estatus, obra una nova dimensió als estudis de classe social, status, desigualtats, mobilitat etc…

Però aquesta ja és una altra història…., que abordada des de les tècniques del data mining obre unes possibilitats als investigadors que donen vertígen.. Per exemple, ¿es poden aplicar tècniques de scoring per a assignar clacular probabilitats de frau fiscal, de la mateixa manera que s’apliquen les tècniques d’escoring creditici des de fa ja dècades?. Les empreses d’aquests tipus de software així ho afirmen en la seva argumentació comercial. I de ben segur en administracions superiors  s’empren. ;)


Padrons municipals i microestadística (I)

7 juny 2011

Aquest article be podria dir-se també misèries i oportunitats de l estadístic municipal. Però, tot i ser un “post” d’un bloc, amb el que té de més informal el canal, hem optat per un títol més canònic…

Misèries.

Un ajuntament, exactament igual que un govern autonòmic o estatal, necessita informació detallada de la realitat humana (població) i física (espai físic) sobre la que ha de dissenyar i aplicar polítiques. Però no sempre és fàcil. De fet, quasi mai és fàcil obtenir dades estadístiques i quantificació de la realitat local. I be ho sabem els tècnics que treballem als observatoris municipals. L’estadística oficial, la que parteix dels plans estadístics oficials del govern central o de l’autonòmic acostuma a basar-se majorment en enquestes. Sovint en base a grans mostres i, per tant, caríssimes. Tot i aquestes grans mostres els resultats tenen uns desagregació territorial limitada. En els millors dels casos es donen dades a nivell de província (estadística estatal) o de comarca (estadística autonòmica). Els municipis estem doncs orfes de dades.

Sort que als municipis teníem els censos decennals!, en que s’inventaria tota la població i tots els habitatges, i que ens donen (uns anys després del treball de camp) centenars de variables estadístiques (més de 500) desagregades fins i tot a nivell de secció censal. Una secció censal ve a ser l’agregat territorial d’ unes 2000-3000 persones. Poc més de 1000 llars. En zones molts denses, això pot representar unes poques illes de cases.

Però s’ha acabat aquesta sort!. El problema de manca de dades s’agreuja a partir del moment de que, degut als rigors pressupostaris, es deixarà de fer censos de població, edificis i vivendes exhaustius, com venia es venia realitzant cada deu anys. A partir d’ara es farà amb una metodologia mixta de cens exhaustiu / enquesta, que no permetrà donar dades a nivell municipal.

Als municipis hem de recórrer a l’explotació de les bases de dades de padrons administratius per a poder conèixer la ciutat, la seva població, el seu territori, la seva economia. Bases de dades que estan integrades en base al cadastre, fet poc conegut fora dels serveis informàtics municipals

Oportunitats.

La bona notícia doncs és que hi ha tot un món per explorar encara per a produir estadística a partir de les bases de dades integrades dels padrons municipals: padró continu (persones), IBI (vivendes), base de dades d’activitats (empreses= , base de dades de brossa, de matriculació de vehicles etc. Tots i cadascun dels seus registres estan referenciats o be a persones (i per tant llars/vivendes) titulars dels bens que tributen (be immoble, activitat econòmica, parking, vehicle, etc) i a la vivenda/local. Totes les dades, i aquest és un fet essencial, estan enllaçades amb la referència cadastral del be immoble (vivenda/local). Així per exemple, tots i cadascun dels habitants empadronats tenen una adreça de residència , i aquesta una referència cadastral.

Per tant, qualsevol estadística que es vulgui plantejar dels objectes enregistrats pot relacionar-se (estudi creuat de bbdd) i desagregar-se a unitats territorials tant petites com necessitem: a nivell de secció censal, com habitualment s’ha fet, però també a nivell de illa cadastral, parcel•la, subparcel•la, número de carrer, etc. De fet, tècnicament podríem fer estadística creuada – a nivell de vivendes o de qualsevol reagrupació proposada de vivendes en funció d’un criteri determinat. Per exemple, segons el valor cadastral de les vivendes, el nivell d’estudis dels habitants, etc..

Per posar un exemple hipotètic, es poden fer anàlisis multifactiorials per a determinar la distribució sobre el territori de les persones/llars segons “estatus” o “classe social” a partir de la regressió lineal i clusterització d’una sèrie de variables que correlacionen força amb la classe social, estatus, o nivell de vida (concepte a escollir per l’investigador en funció del marc teòric): valor cadastral de les vivendes, nombre i categoria dels vehicles de la vivenda, nivell d’estudis, estructura de la llar i nacionalitat, etc.. Que nosaltres coneguem tant sols hem detectat un estudi amb aquest objectiu al del servei d’estadística de l’ajuntament de Barcelona, però usant com a base, les dades agregades a nivell de secció censal. El nostre parer és que les dades s’haurien de creuar a nivell de de vivenda. I desprès desagregar l’estadística resultant al nivell territorial desitjat: de parcel•la o illa cadastral. Un cop definida la funció estadística d’ “estatus/classe social”, replicant l’anàlisi cada any, per exemple, es podria determinar, bastant exactament, la tendència o evolució del grau de cohesió social o desigualtats en el municipi segons zones o segons barris, i el tipus de persones que “marxen” o que “venen” al municipi a través dels canvis residencials.

Òbviament s’ha posat d’exemple un estudi molt complex i ambiciós, que requereix un nivell de feina i de col•laboració dels sistemes informàtics de l’ajuntament (qui gestiona i coneix les bases de dades) molt gran, i difícil d’aconseguir–. Però el que es pretén aquí és mostrar les enormes potencialitats del fet que les bbdd fiscals, poblacionals i territorials estigui integrades, és a dir relacionades. De fet, en això, la microestadística, els municipis tenim un potencial que no tenen ni els instituts estadístics dels governs autonòmics ni centrals (si exceptuem hisenda i la seguretat social!).

Per poder fer aquesta mena d’estudis cal conèixer molt be aquestes bbdd i sobretot com ha anat canviant els criteris de registre, i quina és la legislació que determina que es registra i com, per a minimitzar biaixos causats per l’efecte “de registre”. Però hi ha formes per intentar “neutralitzar-les” raonablement.

Seguirem, en un segon post en aquest bloc, aprofundint en en la “microestadística” amb l’exemple de la integració de dades de padró continu i padró fiscal de bens immobles (lBI).

Josep Vives, Observatori de la ciutat de l’ajuntament de Rubí


Follow

Get every new post delivered to your Inbox.

Join 676 other followers

%d bloggers like this: