And the winner is… “San…joy”

Els passats dies 24 i 25 de febrer, va tenir lloc al Congrés dels Diputats de Madrid el darrer “Debat de l’Estat de la Nació” de l’actual legislatura. Una de les preguntes habituals després d’aquests debats és: “qui ha guanyat el debat?”

Entre els principals diaris de pagament d’àmbit nacional, habitualment, el guanyador és el que més s’acosta al perfil o a la línia editorial del diari. Així, per a El País i El Periódico, el guanyador del debat va ser Pedro Sánchez; mentre que per a El Mundo, ABC i La Razón el guanyador va ser Mariano Rajoy.

Sigui com sigui, molts mitjans de comunicació, el 27 de febrer, van treure una notícia on es deia que, segons l’enquesta feta pel CIS, Pedro Sánchez havia guanyat a Rajoy en el “Debat de l’Estat de la Nació”. Adjunto uns quants enllaços dels articles apareguts en alguns mitjans de comunicació:

El Mundo: Sánchez ganó por la mínima el Debate sobre el estado de la Nación, según el CIS

eldiario.es: Pedro Sánchez ganó el debate a Rajoy por 7 décimas, según el CIS

El Confidencial: El CIS da a Pedro Sánchez ganador del debate del estado de la nación por 7 décimas

El País: Un debate que se resiste a Rajoy

La Vanguardia: Pedro Sánchez ganó el debate del estado de la nación, según el CIS

Televisió Espanyola: Sánchez ganó el debate del estado de la nación a Rajoy por siete décimas, según el CIS

ABC: Sánchez ganó a Rajoy el Debate de la Nación por solo siete décimas

Però com sempre, no hi ha res millor que anar a la font original per verificar si el que apareix en tots aquests articles és cert o no. Així en el web del CIS hi ha l’avenç de dades de l’enquesta que va fer sobre el Debat de l’Estat de la Nació en el següent enllaç: http://datos.cis.es/pdf/Es3055mar_A.pdf. En la pregunta 18, que trobareu en la pàgina 15, és on hi ha la taula en la qual el 21,7% [1] dels enquestats diu que en Pedro Sánchez va guanyar el debat, i un 21% va dir que el guanyador va ser Mariano Rajoy [2].

Sembla, però, que cap mitjà de comunicació no ha fet cas al que apareixia en la pàgina 3 d’aquest mateix informe, és a dir, que els resultats que apareixen en l’informe s’obtenen és a través d’una mostra de 1.678 persones de més de 18 anys, amb un nivell de confiança del 95,5%, i amb màxima incertesa (p=q) l’error real és del 2,4%.

I que vol dir tota aquesta informació tècnica? Doncs bàsicament que els valors que apareixen en l’informe estan extrets d’una mostra, i aquests valors no són únics sinó que en realitat es tracta d’un interval de valors, i per poder afirmar que en Pedro Sánchez va guanyar Mariano Rajoy, l’interval de confiança de Pedro Sánchez no ha de coincidir amb l’interval de confiança de Mariano Rajoy.

La forma tradicional de fer aquest intervals seria utilitzant la fórmula:equacio però avui en dia la informàtica ens permet que calcular els intervals sense utilitzar cap fórmula, utilitzant la tècnica de remostreig.

En què consisteix el remostreig? Es tracta d’extreure a partir de la mostra original un nombre de mostres (normalment és un nombre elevat) de la mateixa mida que la mostra original, la característica d’aquestes mostres és que són mostres amb reposició, és a dir, que tots els individus de la mostra poden ser escollits tants cops com sigui la mida de la mostra. Per fer tots els remostreig he utilitzat R, bé més concretament R-Studio, que és un IDE (integrated development environment) de R.

El resultat d’extreure 10.000 mostres amb reposició d’una mida de 1.173 individus per cada mostra, utilitzant la mostra original de 1.173 individus, i calcular per cadascuna d’aquestes 10.000 mostres el percentatge dels que diuen que ha guanyat el debat Pedro Sánchez, i el percentatge dels que diuen que ha guanyat Mariano Rajoy, és el següent gràfic de densitat.

GD_10000_1173El gràfic mostra un important grau de solapament entre Sánchez i Rajoy, i que significa això? Que els intervals de confiança de Pedro Sánchez y Mariano Rajoy tenen valors en els quals coincideixen. Per tant, es pot concloure, d’acord amb els resultats aportats per l’enquesta del CIS, que Pedro Sánchez no va guanyar a Mariano Rajoy en el debat de l’Estat de la Nació; també es pot concloure que Mariano Rajoy no va guanyar a Pedro Sánchez.

Un dels avantatges que té per mi utilitzar el software R, és que permet simular fàcilment. I això permet veure com varien els gràfics de densitat de Pedro Sánchez i de Mariano Rajoy a mida que s’augmenta la grandària mostral (sota el supòsit que es manté la mateixa distribució percentual de guanyadors del debat que diuen a l’enquesta del CIS). Els resultats gràfics que es mostren a continuació corresponen respectivament a una mostra de 5.000, 10.000, 20.000, 50.000 i 100.000 persones.

GD_10000_5000 GD_10000_10000 GD_10000_20000 GD_10000_50000 GD_10000_100000

A la vista del que mostren els gràfics, podríem dir que si s’haguessin enquestat aproximadament a unes 100.000 persones, i el 21% d’aquests enquestats hagués dit que el guanyador del debat va ser Mariano Rajoy, i el 21,7% hagués dit que el guanyador del debat va ser Pedro Sánchez, en aquest cas si que es podria afirmar que Sánchez va guanyar a Rajoy en el debat, ja que la diferència entre ambdós percentatges es estadísticament significativa.

Per acabar, dues recomanacions si esteu interessats amb el remostreig: primera, mireu-vos vídeo de John Rauser de Pinterest http://youtu.be/5Dnw46eC-0o; i segona, llegiu-vos aquest article de Tim Hesterberg de Google http://arxiv.org/pdf/1411.5279v1.pdf. I si voleu provar-ho vosaltres mateixos, us deixo aquí la sintaxi de R per generar els gràfics que apareixen en aquesta entrada.

 

Gerard Reverté Calvet

Servei d’Estudis i Planificació de l’Ajuntament de Mataró

 

 

[1]El percentatge no és calcula sobre el total d’enquestats (1.678), sinó sobre el total d’enquestats que han dit que sabien que es celebrava el Debat de l’Estat de la Nació, han seguit el desenvolupament del debat, o han obtingut informació sobre el debat a través d’algun mitjà de comunicació, reduint-se a 1.173 el nombre d’enquestats que poden opinar sobre qui creuen és el guanyador del debat.

[2]Si voleu més creuaments podeu accedir-hi a través d’aquest enllaç http://www.cis.es/cis/opencms/ES/NoticiasNovedades/InfoCIS/2015/Documentacion_3055.html

Advertisements

Deixa un comentari

Fill in your details below or click an icon to log in:

WordPress.com Logo

Esteu comentant fent servir el compte WordPress.com. Log Out / Canvia )

Twitter picture

Esteu comentant fent servir el compte Twitter. Log Out / Canvia )

Facebook photo

Esteu comentant fent servir el compte Facebook. Log Out / Canvia )

Google+ photo

Esteu comentant fent servir el compte Google+. Log Out / Canvia )

Connecting to %s

%d bloggers like this: