Startups, empreses i nous models de negoci

13 gener 2017

El passat 2016, Creacció va dur a terme un estudi del sector TIC de la comarca d’Osona. En tant que sector transversal, present a la majoria de cadenes de valor i sector potencialment transformador d’empreses i mercats, el sector TIC demana una atenció especial més enllà del pes específic que pugui tenir en la realitat empresarial d’una comarca (en aquest cas un 2% de la facturació de la comarca i un 4% del nombre total d’empreses).

Fruit d’aquest estudi i de les accions de contrast amb el sector es va aconseguir una fotografia acurada del perfil de les 440 empreses tecnològiques presents a Osona, amb algunes singularitats com presència d’un petit subsector d’infrastructures de telecomunicacions únic a Catalunya o un pes del grup Tic-Industrial superior a la mitjana catalana.

L’estudi també posa de manifest algunes febleses i necessitats que calia treballar amb accions alineades amb les oportunitats que presenten tant la comarca com determinades tendències als mercats on apareixen nous models i empreses que estan canviant la manera de produir i consumir productes i serveis. Llegeix la resta d’aquesta entrada »


Població georeferenciada. Gener 2014

28 Juliol 2016

L’Institut d’Estadística de Catalunya [L’Idescat] ha ofert, per primera vegada, dades de població georeferenciades del Registre de població de Catalunya, a 1 de gener de 2014, amb les variables sexe, edat, nacionalitat i lloc de naixement. Aquí es pot observar el resultat de la mapificació d’aquestes dades amb l’aplicació CartoDB.

Total habitants amb llegenda

Aquest post descriu el tractament d’aquestes dades. L’Idescat les facilita en format Shapefile, a partir del qual es poden mapificar amb una aplicació que reconegui dades georeferenciades (dades associades a coordenades latitud-longitud).

Llegeix la resta d’aquesta entrada »


La tecnologia aplicada a la qualitat de les dades com a generadores de coneixement. El business intelligence (BI) de l’Ajuntament de Rubí

21 Desembre 2015

PENTAHO

En una societat que cada minut genera una quantitat ingent de nova informació, les administracions públiques no poden estar al marge de connectar els indicadors, per tal de generar coneixement útil per a l’organització i els ciutadans en el seu conjunt.

Com deia el desaparegut escriptor Henning Mankell: “Moltes persones cometen l’error de confondre la informació amb el coneixement. No són la mateixa cosa. El coneixement implica la interpretació de la informació (…)”.

És per això que cada cop més administracions locals comencen a treballar en la implantació de sistemes intel•ligents, que permeten gestionar la informació de manera que sigui productiva en si mateixa, que existeixi la retroalimentació de les dades i que se’n puguin generar de noves. Amb tot plegat aconseguim treballar amb un important nivell de qualitat, que pel contrari es dilueix si treballem amb les dades desconnectades o inclús una qualitat que mai no arriben a obtenir. Llegeix la resta d’aquesta entrada »


El 27S a Sabadell

20 Novembre 2015

Prenent l’anàlisi dels resultats del 27S pel municipi de Mollet del Vallès que va fer el company Albert del Amor, de l’Observatori del Vallès Oriental, he decidit fer un exercici semblant per la ciutat de Sabadell, tot emprant CartoDB i l’editor de gràfics de Google. De fet, són tan poques les possibilitats de disposar de dades inframunicipals que, per un dia que en tenim, ho farem “bonic”. Llegeix la resta d’aquesta entrada »


Raspant dades útils a Internet: Web scraping i informació local

10 Juliol 2015

Avui en dia constituiria un exercici poc innovador i atractiu, de cara al lector, abordar l’inici d’aquest article aprofundint en el bast volum d’informació, de tota índole, que l’accés a Internet proporciona als seus usuaris, sigui quina sigui la seva naturalesa, sigui quina sigui la finalitat per la qual hi accedeixen. Simplement, n’hi haurà prou donar una ullada a la següent infografia de Domo per fer-nos una idea de la veritable magnitud d’allò que estem parlant: què hi passa a la Xarxa, en termes de creació de continguts i de trànsit d’informació, en tan sols 60 segons?:

Data never sleeps. Font: www.domo.com

Data never sleeps. Font: Domo

En la mateixa direcció, la pàgina Worldometers.info, en el seu apartat dedicat a la Societat i Mitjans de Comunicació, aventura quina és la progressió en temps real de tota aquella informació que tenim accessible a un sol clic.

Llegeix la resta d’aquesta entrada »


Les trajectòries dels residents a Mataró a través de la Mostra Contínua de Vides Laborals

28 Novembre 2014

Ja fa més de dos anys que no parlàvem de la Mostra Contínua de Vides Laborals (MCVL) i de la seva aplicació a nivell local. Durant en aquests més de dos anys l’Idescat ha començat a publicar informació de la MCVL a nivell local (aquí), però vull recordar que des del Servei d’Estudis de l’Ajuntament de Mataró venim publicant dades de la MCVL (principalment per l’àmbit del nostre municipi) des del 2010 (aquí), si bé es cert que no ho venim fent de forma regular.

El motiu d’aquesta manca de regularitat en l’explotació de la MCVL és ben senzill; per una administració local, emprendre l’anàlisi d’una base de dades tan gran (més de 9 GB de dades, 5 taules que ocupen 22 fitxers, i més de 20 milions de registres) i tan complicada (més de 130 variables) resulta una tasca titànica, ja que per tal d’analitzar les dades és requereix d’ordinadors prou potents, es requereix de personal amb coneixements de programació i es requereix de temps. Afortunadament per a l’Ajuntament de Mataró la contractació d’un pla d’ocupació, Antoni Braza, amb formació estadística i coneixements avançats de programació ens està permetent afrontar l’estudi de la MCVL de l’any 2013, tant amb l’onada sense dades fiscals com amb dades fiscals.

L’objectiu d’aquesta entrada no és tant veure les trajectòries laborals dels mataronins, com d’una banda insistir en l’ús de la MCVL per analitzar més a fons la situació laboral a nivell local (dels municipis de més de 40.000 habitants), i per altra banda mostrar el paquet TraMineR que permet fer gràfics de les trajectòries d’individus. Llegeix la resta d’aquesta entrada »


Una aproximació a la cartografia multiescala

31 gener 2014

A l’era de la geolocalització, ara que  Google i altres monstres han aconseguit ‘educar’ la ciutadania en la utilitat i gran necessitat d’explicar on passen les coses, parlar de l’escala de la cartografia pot resultar fins i tot ridícul si es fa atenent a l’antiga concepció de l’escala de representació. A ningú se li escapa que la trepidant escalada tecnològica en producció i disponibilitat de la cartografia d’imatge ha popularitzat la georefernciació fins a nivells insospitats fa tan sols 5 o 6 anys.  No només donem per suposat que la ‘Xarxa’ ens informa d’on està qualsevol cosa sinó que ens sembla la mar de normal  veure tot el planeta i passejar a nivell de vorera o entrar dins un edifici amb Street View només amb un moviment de dit en un dispositiu mòbil des de la terrassa d’un bar. Entre dos glops de cervesa podem passar de veure el món a escala 1:1.000.000 a 1:20 en pocs segons. Els antics cartògrafs se’n farien creus! I per si no fos prou, hi veiem directament el món i no la seva representació.

topo_viewLes cartoteques en paper han anat desapareixent de l’ús quotidià i l’escala de representació de mapes i plànols pràcticament ja només respon a determinats tràmits administratius o a limitacions tècniques locals en la distribució de sèrie cartogràfiques. Estem en un punt que seria senzill engrescar-se amb la idea  de reconvertir els plànols d’emplaçament i fer circular tots els intercanvis de dades i expedients amb alguna mena de ‘xip’  integrat, que inclogui la visualització dels àmbits de treball. Tot arribarà. Llegeix la resta d’aquesta entrada »


La innovació en el sector de la gent gran a través de l’anàlisi de patents

13 Desembre 2013

La població mundial està envellint ràpidament, segons l’Organització Mundial de la Salut (OMS), en gairebé tots els països, la proporció de persones majors de 60 anys creix més ràpid que qualsevol altre grup d’edat). D’aquí a 35 anys, hi haurà més persones vives al món de més de 60 anys que persones menors de 15.

Els efectes de l’envelliment sobre la població, tal com indiquen estudis recents -com el d’A. T. Kearning, “Understanding the needs and the consequences of the Ageing Consumer“-, serà enorme a nivell social i també afectarà fortament a nivell dels comerços i les indústries manufactureres.  A aquestes indústries se’ls presenta, doncs, una oportunitat relacionada amb saber identificar les noves necessitats i expectatives canviants de la societat per tal de generar nous béns i serveis que en puguin respondre.

Ens preguntem quin tipus d’innovacions relacionades amb la gent gran estan essent protegides per patents avui dia al món. Per això realitzem una cerca general a la base de dades global d’IFI Claims sobre patents relacionades amb envelliment, gerontologia i longevitat. Obtenim 5.625 documents de patents i models d’utilitat publicats durant els últims 5 anys. La representació dels resultats (figura 1) es genera amb l’eina de visualització analítica KMX; aquest software ens permet representar les patents com a punts situats en un pla vectorial. En aquest tipus de representació en forma de paisatge topogràfic, les patents amb contingut textual similar, s’agrupen automàticament formant clústers temàtics.

Figura 1. Representació de les patents en un pla vectorial

Figura 1. Representació de les patents en un pla vectorial

Llegeix la resta d’aquesta entrada »


Ens assemblem o no els municipis del Perfil de la Ciutat?

27 Setembre 2013

Quan disposem d’un volum important d’informació (variables i registres), amb l’anàlisi clàssica descriptiva pot ser molt complicat (o quasi impossible) extraure’n alguna conclusió conjunta. És en aquest punt que ens pot interessar fer servir algun mètode (estadístic) que ens permeti sintetitzar (o agrupar) la informació disponible, per tal de facilitar la nostra anàlisi i arribar a conclusions a les quals amb l’estudi univariant habitual no seria possible d’arribar.

Vegem-ho amb un exemple: prenem la taula d’indicadors del capítol de Demografia del darrer Informe del Perfil de la Ciutat. Les dades que obtenim per al conjunt de municipis analitzats són les que s’observen en el quadre següent:

Taula

Amb aquesta informació podem veure que Santa Coloma de Gramanet és on menys creix la població en els últims deu anys o que Barberà del Vallès és el municipi que registra una taxa més baixa de població estrangera. Ara bé, intentar una anàlisi conjunta a partir de la visualització directa de la informació no seria un exercici senzill (Barberà i Santa Coloma tenen algun comportament comú?). Així doncs, ens plantejarem emprar un mètode estadístic de síntesi de la informació que ens permetrà resumir-ho en poques variables. L’anàlisi en qüestió és la de Components Principals: Aquesta anàlisi estadística consisteix a sintetitzar la informació disponible, tot reduint el nombre de variables disponibles i agrupant-les.

Així doncs, i fent servir en nostre programari d’anàlisi estadística habitual, R, obtenim els següents resultats després d’aplicar una anàlisi de Components Principals:

Resultats acp

Els resultats mostren que el més raonable seria reduir el nombre de variables a tres components principals. La justificació: amb tres components expliquem el 89% de tota la informació disponible, percentatge més que suficient (de fet, amb dues ja disposem d’un 71%, percentatge que també es podria considerar suficient). El pas següent serà etiquetar cada una d’aquestes components, a partir de la (cor)relació que tenen amb les nostres variables originals.

Component 1: correlacionada positivament amb les variables densitat i mitjana d’edat. Aquesta component resumiria la informació relacionada amb el grau de concentració de la població.

Component 2: la segona component està correlacionada, negativament, amb la variable envelliment. Per tant, aquesta component ens indica els municipis amb un menor pes de gent gran (i, en conseqüència, amb un més pes d’edats joves i madures).

Component 3: la tercera component està correlacionada positivament amb les variables taxa de fecunditat, taxa de natalitat i percentatge de població estrangera. Aquesta component ens indicaria els municipis amb un % de fecunditat més elevat.

Ara ja tenim sintetitzada la informació disponible, tot reduint el nombre de variables inicials (9) en 3 (components). El pas següent en la nostra anàlisi serà agrupar els nostres municipis a partir de les noves variables (components) obtingudes, donant resposta, així, al grau de semblança que tenen els municipis. És el que es coneix com a Anàlisi Clúster. Aquesta tècnica estadística és, en realitat, un conjunt de tècniques estadístiques que tenen com a objectiu agrupar elements semblants en grups o clústers. En aquest cas, el que emprarem serà el mètode jeràrquic o de classificació.

Utilitzant R, el resultat d’aplicar aquest mètode s’obté a continuació (en forma de gràfic):

Dendo

Amb el gràfic s’observa que els nostres municipis es poden classificar en cinc grups:

Un primer integrat pel municipi de Santa Coloma de Gramanet.

Un segon integrat pel municipi de Vic.

Un tercer integrat pel municipi de Manresa.

Un quart format pels municipis de Barberà del Vallès, Mollet i Rubí. Aquests municipis, doncs, formen un clúster de municipis que es caracteritzen per tenir una població més jove respecte de la resta de municipis analitzats.

I el cinquè clúster està integrat per la resta de municipis: Girona, Granollers, Lleida, Mataró, Sabadell, Terrassa i Vilafranca del Penedès. En aquest cas, aquests municipis no es caracteritzen per destacar, ni en un sentit ni em l’altre, amb cap de les components seleccionades.

Així doncs, i com a conclusió final, la utilització d’aquestes tècniques estadístiques ens ha permès veure el grau de semblança (o diferència) entre els municipis que formen part del Perfil de la Ciutat a partir d’una sèrie de variables originals, tot agrupant-les i generant-ne de noves a partir de les correlacions que s’estableixen entre les variables inicials i les components finals.

Observatori de l’Economia Local de Sabadell


Eines d’anàlisi: R i R-Commander

5 Desembre 2012

Més enllà de l’habitual anàlisi comparativa dels diferents municipis que integren la xarxa del Perfil de la Ciutat, l’anàlisi de mètodes o tècniques o bé l’opinió sobre temàtiques concretes, també hi ha la voluntat, des d’aquest blog, de presentar i/o difondre eines que ajudin a una millor interpretació de la informació disponible. I si aquestes eines són lliures i de distribució gratuïta, encara millor.

Així doncs, el post d’avui el dedicaré a presentar (no és un manual!) una eina que pot resultar molt útil per a tothom que treballi amb dades i requereixi eines que vagin més enllà de l’habitual full de càlcul. Aquesta eina és l’R, un programari lliure i gratuït que es basa en el llenguatge de programació per poder fer anàlisi estadística. Us el podeu descarregar des de l‘enllaç següent:

http://www.r-project.org

Gràf 1

De l’R ja fa temps que se’n parla, sobretot en l’àmbit universitari, ja que és una eina gratuïta, potent i lleugera. Un exemple d’això que dic el visualitzem en el següent gràfic, on queden comptabilitzats el nombre de posts que parlen d’R en el blog r-bloggers en els últims anys:

Gràf 2

Quan dic que R és una eina potent, em refereixo a què, actualment, al repositori d’R hi ha disponibles més de 4.000 paquets diferents. Cap software estadístic comercial actual disposa d’aquesta àmplia gamma de paquets d’anàlisi, i no únicament estadístic, sinó que també permet fer anàlisis demogràfics, o de programació lineal, o càlculs financers, etc. Quan dic que R és una eina lleugera, em refereixo a que quan s’arranca un software estadístic comercial actual, el programari triga un temps (depenent de la potència de l’ordinador) en carregar tot el programa; en canvi amb R, el programa es carrega molt ràpidament, ja que no instal·la tots els paquets disponibles sinó únicament uns paquets bàsics; és l’usuari qui en funció de l’anàlisi que vulgui fer ha de carregar el paquet adient.

Tal com dic a la introducció, R és en llenguatge de programació. Això vol dir que qualsevol que vulgui utilitzar aquesta eina necessita certs coneixements previs de programació (informàtica). Per evitar que potencials usuaris “fugin” d’aquesta eina (més pel fet de no disposar d’aquests coneixements previs de programació, i no tant d’estadística), hi ha la possibilitat de poder descarregar i instal·lar (des del mateix entorn) l’R Commander. Què és l’R Commander? És una interfície tipus finestra que cobreix la major part de les anàlisis estadístiques més habituals en uns menús desplegables, als quals estem bastant acostumats els usuaris que hem treballat alguna vegada amb un paquet estadístic basat en aquest tipus d’entorn.

Així doncs, amb l’R Commander podrem realitzar una anàlisi estadística sense haver de tenir un cert domini de llenguatge de programació i en un entorn en què el seu ús ens és familiar. A més, alhora que l’utilitzem, ens podrem familiaritzar amb el llenguatge de programació, ja que el programa incorpora una pantalla on podem anar veient la majoria d’operacions que anem realitzant amb els menús. Això ens permetrà anar aprenent llenguatge de programació (sintaxi), que ens podrà ser útil per a posteriors anàlisis sense la necessitat d’haver de recórrer, de nou, a l’ús dels menús desplegables. Si voleu aprofundir una mica més sobre R i R-Commander, la Universitat de Cadis ha editat un llibre gratuït titulat Estadística bàsica con R y R-Commander.

Sense entrar en aspectes funcionals de l’eina (hi ha manuals disponibles des del mateix enllaç on et pots descarregar el programa), un aspecte que m’agradaria destacar d’aquesta eina és la seva facilitat en la importació de fitxers de dades des d’altres entorns (fulls de càlcul, bases de dades, txt), entorns, tot sigui dit, en què és habitual que hi tinguem la majoria de la informació emmagatzemada.

Per acabar, i tal com he dit des del principi, aquest post té com a objectiu presentar (que no fer de manual) una eina disponible a la xarxa que permet fer anàlisi quantitativa i estadística, en un entorn conegut, i sense la necessitat d’haver d’adquirir un programari estadístic que requereixi de llicència comercial, aspecte, aquest últim, que pot apropar “per a tots els púbics” funcionalitats que fins ara només estaven a l’abast d’una minoria.

Observatori de l’Economia Local de Sabadell


A %d bloguers els agrada això: