Enrera
Mòdul 5
Estadística amb el full de càlcul: usos didàctics
  Pràctica
1
2
3
4
5
6
   
Exercicis
Exercicis
  Les distribucions de probabilitat contínues  Documentació
Glossari
Glossari
 
 
Probabilitats en enquestes amb mostres grans
   

En aquesta pràctica es mostra la manera com la distribució normal permet calcular els valors de les probabilitats associades amb la distribució binomial que, altrament, no es poden obtenir.

En aquest cas, l'aproximació s'aplica al tractament d'una enquesta amb una mostra gran que faria pràcticament inviable el tractament directe.

Els objectius d'aquesta pràctica, com en l'anterior, són:

  • Entendre que de vegades és imprescindible aproximar la binomial per la normal.
  • Fer càlculs de probabilitats i de valors crítics amb l'Excel fent servir l'aproximació indicada.
Pràctica
Exemple: Una enquesta d'opinió
   

A la pràctica 3 del mòdul 4 hem resolt qüestions relatives a una enquesta que es fa escollint una mostra de mida 100 en una població on només el 47 % dels veïns són favorables a la gestió municipal. Per obtenir més rigor en els resultats, l'ajuntament decideix fer una enquesta a una mostra més nombrosa i per això la fa a 2.000 persones de la població.

  1. Quina és la probabilitat que l'enquesta assenyali una majoria de persones favorables a la gestió municipal?
  2. Quina és la probabilitat que el resultat de l'enquesta indiqui entre un 45 % i un 49 % de respostes favorables?
  3. Quina és la previsió de resultats més habituals que podem fer amb una probabilitat d'encert del 95 %? (Aquesta previsió defineix el que es coneix com a interval de tolerància o de confiança del 95 %.)
   
  Resolució
   
 

Si X és la variable aleatòria nombre de persones de la mostra favorables a la gestió municipal, aquesta variable té una distribució binomial amb n = 2000, p = 0,47 i q = 0,53. En aquest cas, l'Excel no permet fer els càlculs directament amb la distribució binomial, però és absolutament clar que podem emprar l'aproximació mitjançant la normal Xn de mitjana 2000 · 0,47 = 940 i desviació estàndard 22,32 donada per .

La pregunta que volem respondre a l'apartat a ens porta a considerar que 1.001 persones de la mostra (o més) haurien de ser favorables a l'alcalde. Si tenim en compte la correcció de continuïtat, hem de calcular p[Xn > 1000,5] = 1 - p[Xn < 1000,5].

  • En el mateix full que teniu per treballar la pràctica anterior, entreu a A1 2000 i a A2 0,47. Observeu que les fórmules que teniu a A3 i A4 calculen la mitjana, 940, i la desviació estàndard, 22,32.
  • Entreu a B1 1000,5. La fórmula que teniu a la C1 calcula p[Xn > 1000,5] = 0,99664.
  • Només cal calcular 1 - 0,99664 i ja teniu la probabilitat que buscàveu (inferior al 0,4 %).

Resoleu ara l'apartat b. Com que ara ens preguntem per la probabilitat que a la mostra hi surtin entre 900 (45 % de 2.000) i 980 (49 % de 2.000) persones favorables, heu de calcular

p[899,5 < Xn < 980,5]

  • Entreu a la cel·la B1 i B2 del mateix full de treball els valors 980,5 i 899,5.
  • Assegureu-vos que a les cel·les C1 i C2 hi les fórmules que calculen les probabilitats corresponents, així com ho heu fet a la pràctica 3.

Si a C3 teniu la fórmula =C1-C2, ha sortit la probabilitat que es buscava, que és del 93,04 %. És molt gran, doncs, la probabilitat que una enquesta feta a 2.000 persones (si la mostra està ben triada!) s'acosti a la veritable proporció. Tot seguit ho constatarem a la inversa.

Al darrer apartat, per esbrinar l'interval de valors més plausibles, el buscarem centrat en la proporció real (que en aquesta simulació ens és coneguda). Com que en aquesta zona central de valors hi ha simetria de la distribució de probabilitat, si volem l'interval que correspon a una probabilitat del 95 % (o bé 0,95) resultarà que l'extrem esquerre correspondrà a una probabilitat acumulada de 0,025 i l'extrem dret a una probabilitat de 0,975. Vegeu l'esquema que explica aquesta situació:

  • Entreu a D1i a D2 del full que esteu fent servir actualment els valors 0,975 i 0,025.
  • Assegureu-vos que a les cel·les E1 i E2 i les fórmules que heu fet servir a la pràctica 3, és a dir, =DISTR.NORM.INV(D1;$A$3;$A$4) i =DISTR.NORM.INV(D2;$A$3;$A$4), respectivament. Els resultats que apareixen en aquestes cel·les són 983,7471041 i 896,2528959.

A partir de les sortides obtingudes en pantalla, podem procedir de dues maneres.

  • La primera és pensar que cal fer una previsió amb nombres enters (estem parlant de nombre de persones!). No es tracta ben bé d'arrodonir, sinó de pensar en el que sabem, és a dir, que p[896,2536 X 983,7464] = 0,95 i en que volem donar un interval centrat en la mitjana (940) amb probabilitat del 95 % o superior. Trobareu, doncs, que cal considerar l'interval [896, 984] que té una probabilitat una mica superior al 95 %, cosa que no passaria amb l'interval [897, 983] que queda a dintre de l'interval que ens ha donat l'ordinador.
    A partir d'aquesta idea podeu fer, doncs, la previsió següent: "A l'enquesta sortiran entre 896 i 984 persones favorables". Aquesta previsió té una probabilitat d'encert (nivell de confiança) superior al 95 % i, doncs, un risc d'error inferior al 5 %.

  • La segona manera és posar l'èmfasi en la pregunta "Amb quin titular s'enunciaria aquesta previsió als mitjans de comunicació?", que com molt bé sabeu té com a resposta: amb tants per cent.

    • A partir d'aquesta idea podríem continuar el procediment anterior i observeu a quins percentatges de la mida de la mostra corresponen les 896 i les 984 persones.

    • Però, tanmateix, si centrem l'atenció en aquest punt de vista dels percentatges sembla molt més recomanable (i més ajustat "objectivament" al 95 %) passar directament dels valors observats en pantalla, a saber, 983,7471041 i 896,2528959, a percentatges respecte les 2000 persones que conformen la mostra.

      Aquests percentatges són (arrodonint al segon decimal) 49,19 % i 44,81 %, que com podeu veure defineixen un interval centrat en el valor esperat, el 47 %.

      El radi d'aquest interval, 2,19 %, és el marge d'error amb què faríem la predicció del resultat en aquest problema de probabilitats o simulació que estem resolent.

En resum, els mitjans de comunicació triarien per a fer la seva previsió:

"Amb un nivell de confiança del 95 % podem dir que a l'enquesta sortiran un 47 % de persones favorables amb un marge d'error màxim del 2,19 %".

Però recordem que fins ara hem estat fent previsions o simulacions per saber què passa quan es fa una enquesta, però que el plantejament pràctic de les enquestes, el d'estimar la proporció amb què una característica es dóna en una població, es tracta al mòdul 7.

 
Pràctica Simulació de l'aproximació de la binomial per la normal
   
 

En aquest apartat fareu servir l'aplicació que anomenem PROBABILITAT.XLS i que trobareu a la carpeta usual dels fitxers de treball. La part que fareu servir us pot ajudar a il·lustrar l'aproximació de la binomial per la normal.

  • Obriu PROBABILITAT.XLS, premeu el botó Habilitar macros per fer-la activa del tot.
  • Premeu el botó Binomial i normal.
  • Aneu prement els botons per variar els valors de n i p i observeu els productes np i nq que es van calculant automàticament. Segons com siguin aquests valors, l'aproximació és millor o pitjor.
  • Aneu provant diferent combinacions de valors i observeu com va variant el gràfic.
  • També podeu calcular probabilitats comparant els dos models (binomial exacte i aproximat per la normal).
  • Si trieu l'opció afirmativa en la pregunta Histograma? veureu al gràfic l'histograma que serveix per comparar millor l'àrea sota la corba i l'àrea delimitada pels rectangles de l'histograma. Si voleu més informació sobre el tema, accediu al document teòric d'aquest mòdul.
 
Amunt