Ens assemblem o no els municipis del Perfil de la Ciutat?

Quan disposem d’un volum important d’informació (variables i registres), amb l’anàlisi clàssica descriptiva pot ser molt complicat (o quasi impossible) extraure’n alguna conclusió conjunta. És en aquest punt que ens pot interessar fer servir algun mètode (estadístic) que ens permeti sintetitzar (o agrupar) la informació disponible, per tal de facilitar la nostra anàlisi i arribar a conclusions a les quals amb l’estudi univariant habitual no seria possible d’arribar.

Vegem-ho amb un exemple: prenem la taula d’indicadors del capítol de Demografia del darrer Informe del Perfil de la Ciutat. Les dades que obtenim per al conjunt de municipis analitzats són les que s’observen en el quadre següent:

Taula

Amb aquesta informació podem veure que Santa Coloma de Gramanet és on menys creix la població en els últims deu anys o que Barberà del Vallès és el municipi que registra una taxa més baixa de població estrangera. Ara bé, intentar una anàlisi conjunta a partir de la visualització directa de la informació no seria un exercici senzill (Barberà i Santa Coloma tenen algun comportament comú?). Així doncs, ens plantejarem emprar un mètode estadístic de síntesi de la informació que ens permetrà resumir-ho en poques variables. L’anàlisi en qüestió és la de Components Principals: Aquesta anàlisi estadística consisteix a sintetitzar la informació disponible, tot reduint el nombre de variables disponibles i agrupant-les.

Així doncs, i fent servir en nostre programari d’anàlisi estadística habitual, R, obtenim els següents resultats després d’aplicar una anàlisi de Components Principals:

Resultats acp

Els resultats mostren que el més raonable seria reduir el nombre de variables a tres components principals. La justificació: amb tres components expliquem el 89% de tota la informació disponible, percentatge més que suficient (de fet, amb dues ja disposem d’un 71%, percentatge que també es podria considerar suficient). El pas següent serà etiquetar cada una d’aquestes components, a partir de la (cor)relació que tenen amb les nostres variables originals.

Component 1: correlacionada positivament amb les variables densitat i mitjana d’edat. Aquesta component resumiria la informació relacionada amb el grau de concentració de la població.

Component 2: la segona component està correlacionada, negativament, amb la variable envelliment. Per tant, aquesta component ens indica els municipis amb un menor pes de gent gran (i, en conseqüència, amb un més pes d’edats joves i madures).

Component 3: la tercera component està correlacionada positivament amb les variables taxa de fecunditat, taxa de natalitat i percentatge de població estrangera. Aquesta component ens indicaria els municipis amb un % de fecunditat més elevat.

Ara ja tenim sintetitzada la informació disponible, tot reduint el nombre de variables inicials (9) en 3 (components). El pas següent en la nostra anàlisi serà agrupar els nostres municipis a partir de les noves variables (components) obtingudes, donant resposta, així, al grau de semblança que tenen els municipis. És el que es coneix com a Anàlisi Clúster. Aquesta tècnica estadística és, en realitat, un conjunt de tècniques estadístiques que tenen com a objectiu agrupar elements semblants en grups o clústers. En aquest cas, el que emprarem serà el mètode jeràrquic o de classificació.

Utilitzant R, el resultat d’aplicar aquest mètode s’obté a continuació (en forma de gràfic):

Dendo

Amb el gràfic s’observa que els nostres municipis es poden classificar en cinc grups:

Un primer integrat pel municipi de Santa Coloma de Gramanet.

Un segon integrat pel municipi de Vic.

Un tercer integrat pel municipi de Manresa.

Un quart format pels municipis de Barberà del Vallès, Mollet i Rubí. Aquests municipis, doncs, formen un clúster de municipis que es caracteritzen per tenir una població més jove respecte de la resta de municipis analitzats.

I el cinquè clúster està integrat per la resta de municipis: Girona, Granollers, Lleida, Mataró, Sabadell, Terrassa i Vilafranca del Penedès. En aquest cas, aquests municipis no es caracteritzen per destacar, ni en un sentit ni em l’altre, amb cap de les components seleccionades.

Així doncs, i com a conclusió final, la utilització d’aquestes tècniques estadístiques ens ha permès veure el grau de semblança (o diferència) entre els municipis que formen part del Perfil de la Ciutat a partir d’una sèrie de variables originals, tot agrupant-les i generant-ne de noves a partir de les correlacions que s’estableixen entre les variables inicials i les components finals.

Observatori de l’Economia Local de Sabadell

Advertisements

Deixa un comentari

Fill in your details below or click an icon to log in:

WordPress.com Logo

Esteu comentant fent servir el compte WordPress.com. Log Out / Canvia )

Twitter picture

Esteu comentant fent servir el compte Twitter. Log Out / Canvia )

Facebook photo

Esteu comentant fent servir el compte Facebook. Log Out / Canvia )

Google+ photo

Esteu comentant fent servir el compte Google+. Log Out / Canvia )

Connecting to %s

%d bloggers like this: