Padrons municipals i microestadística (II): el padró continu d’habitants

2 desembre 2011

Aquest article és una continuació del que varem publicar fa uns mesos, Padrons Municipals i Microestadística (I), i que  continuarem amb articles posteriors.

L’objectiu d’aquest article és donar a conèixer a la comunitat investigadora, als estudiosos, i als planificadors, la informació que “dorm” a les bases de dades dels padrons continus, així com el seu enorme potencial per a generar coneixement bàsic sobre la dinàmica demogràfica i territorial de les ciutats (i per elevació dels territoris supramunicpals). Coneixement pràctic per a planificar polítiques i gestionar projectes des de les administracions.

L’estadística oficial del padró continu.

Com tots els investigadors socials que no han treballat mai “dins” d’un ajuntament, o que hi han treballat però no han tingut ocasió de “tafanejar” les bases de dades de l’ajuntament “al costat” dels informàtics que les gestionen i les coneixen a fons, la meva idea de les estadístiques de població del padró continu que podíem analitzar era la que té tothom sobre la habitual i estàndard explotació estadística del padró continu.

L’INE/IDESCAT, a nivell d’estadística oficial, sols treu aprofitament estadístic de les següents variables: Sexe, Nacionalitat, Lloc de naixement, Data de naixement, Lloc de residència, Edat,  Relació entre Lloc de Residència i el Lloc de Naixement, a partir del que disposa el marc normatiu del padró continu.

L’estadística oficial es genera sols per aquestes 5 variables, amb escassos creuaments entre elles, a una sola data de tall anual (u de gener), i a una desagregació territorial màxima de secció censal, que vindria a ser unes quantes illes de cases, o moltes illes si són zones de baixa densitat (urbanitzacions, per exemple).

El padró continu, una base de dades relacional.

L’estadística sol generar-se a partir de taules planes: files (individus) per columnes (variables). Per entendre’ns, un full d’Excel o una taula d’Acces. Desgraciadament, la majoria dels que generem estadística no coneixem prou el mòn de les bbdd relacionals i dels sistemes gestors de bases de dades (SMDB)…

La base de dades informàtica del padró continu està gestionada per un DBMS (Oracle habitualment), amb la quasi infinita potència analítica que això suposa. El DBMS pot ser interrogat (queries en llenguatge informàtic), sobre qualsevol aspecte, filtre o condició que ens puguem imaginar. Qualsevol texte, codi o número d’una bbdd relacional pot usar-se com a condició, filtre o base de la pregunta que vulguem fer al sistema. Però en el seu llenguatge: l’SQL o derivats. Per fer doncs anàlisis més aprofundits caldrà treballar doncs amb l’administrador informàtic de la bbdd, que és qui en coneix l’estructura del model de dades (molt complexa) del padró continu i les possibilitats tècniques.

A banda de les 5 variables famoses, la base de dades registra i codifica tots els moviments o canvis en les dades dels empadronats: altes o baixes cap a altres municipis i països (migració intermunicipal), però també canvis de domicili dins del mateix municipi (migració intermunicipal). Un altre codi que es registra és la renovació padronal dels estrangers, obligatoria cada pocs anys des del 2005.

Mes enllà de l’estadística oficial…

L’estadística oficial és de peridocitat anual i de stock o tall a un dia concret (exceptuant el cas de les estadístiques de variacions residencials a partir del que es construeixen les dades de moviments migratoris)  i amb un retard en la publicació d’un any aproximadament. En canvi, l’actualització de les bases de dades del padró continu a nivell de l’ajuntament és pràcticament contínua. L’intercanvi i actualització de dades entre l’INE (que creua les dades dels municipis amb altres bases de dades) i els ajuntaments es fa de forma automatizada i mensual. La nostra experiència és que les dades ja són prou “solides” després de tres mesos de la data de tall, com a molt aviat, doncs s’han d’incorporar les dades que procedeixen del INE, i registres oficials (naixements, morts, etc).

Habitualment, ni a nivell acadèmic ni a nivell de les pròpies administracions, almenys pel que ens consta a nosaltres, no es solen fer explotacions “mes aprofundides” de les bases de dades del padró continu. Si més no, no es publiquen. Però tampoc es fan grans explotacions a nivell “intern”, per a necessitats de planificació o gestió, més enllà de representar les dades sobre el SIG corporatiu intern. Trobem algunes excepcions en algun ajuntament gran Barcelona o Mataró, casos que ens “mostren” la punta del iceberg de les enormes possibilitats analítiques d’aquesta bbdd. Al portal d’opendata de l’ajuntament podem veure un bon aprofitament estadístic de les dades del padró continu; els companys del Servei d’Estudis i Planificació de Mataró, integrants de la xarxa de la que aquest bloc n’és expressió, també fan una bona publicació anual a partir de l’explotació més aprofundida del padró continu.

Una base de dades amb memòria històrica. Anàlisis longitudinals?

Un fet poc coneguts pels investigadors,  i que és d’extrema importància, és que el padró continu es una bbdd que guarda l’històric dels seus registres!. És a dir, puc interrogar a la bbdd sobre la població actual, peró també sobre la població i totes les seves característiques a qualsevol data anterior. Avui, a finals del 2011 podem interrogar a la base de dades per a que ens reprodueixi la  “imatge stock” del dia 6 de Febrer del 2003, o un  “acumulat de moviments” (altes, baixes, migracions, naixements, morts, renovacions padronals d’estrangers) entre els dies 6 de Maig i 3 de Juliol del 2008). Obviament, cada registre-persona o registre-moviment amb totes les variables i codis associats a la persona o el moviment “en aquell moment”.

Tècnicament és possible fer estudis longitudinals de com canvien les persones, les llars, els assentament en les zones, els edificis, els pisos…. Increible!. Encara recordo quan vaig descobrir que la bbdd guardava tot l’historic de tots els canvis en les dades…, li vaig preguntar quatre vegades seguides al informàtic…. No m’ho creia!. Ara sé que si no es fa és o per desconeixment dels potencials interessats (investigadors, però  també els mateixos tècnics i planificadors municipals i de les altres administracions) o per la complexitat tècnica de l’extracció de la informació i el seu al cost en recursos humans dels departaments de informàtica (sempre sobrecarregats de feina). Cal treballar costat a costat amb l’informàtic administrador de la base de dades i el funcionari responsable del manteniment del padró, i millor que aquests tinguin experiencia llarga en el padró per controlar canvis que s’hagin produït en la manera de registrar les dades, en els codis determinats per l’INE o altres modifiacions tecnico-administratives que poden dificultar la interpretació correcta de les estadístiques produides.

Així doncs, la base de dades conté també tota la informació padronal de les persones que han viscut al municipi en un moment donat i i ja no hi viuen, per defunció o per canvi de residència. Ens permet viatjar cap el passat. La “historicitat” té però una limitació temporal: l’any en que es va iintroduir el padró a l’ajuntament en un DBMS comme il faut, en algun moment lleugerament posterior  al 1996 (inici del padró continu). En el cas de l’ajuntament de Rubí aquest moment va ser a mitjans del 1999. A Rubí podria retrocedir, posar la lupa a qualsevol moment de la darrera dècada, una dècada apassionant pels enormes canvis demogràfics i territorials.

Estudiar estructures de llars?.

Habitualment també es treballa l’estadística de número de persones empadronades al mateix be immoble (per exemple, per a detectar pisos patera). Però tècnicament pensem que seria possible analitzar les estructures de les llars a partir de la construcció de tipologies a partir del nombre de persones cohabitants, el seu sexe i edat. I també els canvis en aquestes estructures per canvis en el lloc d’empadronament dels seus components al llarg del temps, fet que no es pot fer en cap altra font estadística a nivell municipal, doncs els censos són dades de stock.

Una bona notícia: l’actualització de la variable nivell d’estudis.

Una de les variables obligatòries de la que  no se n’ha fet fins ara cap aprofitament estadístic a nivell d’estadística oficial  és el nivell d’estudis dels empadronats. Com figura al marc normatiu, és obligatori recollir el nivell d’estudis acreditat del veí. Peró els veïns no van a actualitzar les seves dades cada cop que adquireixen un nou nivell educatiu. Per tant, es una variable tremendament desactualitzada… fins ara. Segons explicacions del funcionari responsable del padró continu al meu municipi, des de finals del 2008 l’INE creua les dades del padró continu amb les dades del ministeri d’educació i, a partir d’aquí envia als ajuntaments les dades actualitzades. Caldrà doncs fer algunes explotacions per a veure el nivell i fiabilitat d’aquesta dada, que seria de gran interès per la seva correlació amb la classe social o l’estatus de les llars.

Una base de dades amb detall geogràfic il·limitat.

Com ja varem comentar al anterior post sobre microdades, almenys en els ajuntaments mitjans i grans, amb prouta infrastructura informàtica, l’identificador (ID) de la persona està associat informàticament al ID de la referència cadastral del be immoble en el que resideix. Com també hi estan relacionats el ID dels vehicles que paguen llicència en aquell municipi, o els IDsi de les transaccions fiscals d’aquella persona, i d’aquella llar (si acceptem l’equivalencia entre “llar” i persones residents al mateix “be immoble”) amb l’ajuntament.

L’associació entre el ID del habitant i el ID del be immoble fa que puguem combinar les dades del padró continu amb qualsevol capa de dades geogràfiques i fer-ne anàlisis creuats, com ja s’ha comentat en altres posts.

L’assoaciació entre dels dos elements anteriors amb objectes fiscals, particularment els cotxes de la llar/immoble, dels que es tenen totes les dades al padró de vehicles (model concret, potència, cavallatge), i que correlaciona fortament amb la classe social o l’estatus, obra una nova dimensió als estudis de classe social, status, desigualtats, mobilitat etc…

Però aquesta ja és una altra història…., que abordada des de les tècniques del data mining obre unes possibilitats als investigadors que donen vertígen.. Per exemple, ¿es poden aplicar tècniques de scoring per a assignar clacular probabilitats de frau fiscal, de la mateixa manera que s’apliquen les tècniques d’escoring creditici des de fa ja dècades?. Les empreses d’aquests tipus de software així ho afirmen en la seva argumentació comercial. I de ben segur en administracions superiors  s’empren. ;)


Follow

Get every new post delivered to your Inbox.

Join 690 other followers

%d bloggers like this: