Saltar la navegación

Intervalo de confianza para a proporción

 

Consideramos X unha variable aleatoria B (n, p)

Para tamaños grandes de n, n> 30, a distribución binomial aproxímase a unha distribución normal: 

\(X \to {N(np,} \sqrt{npq}{)}\)

Sabemos de estatística puntual, que a distribución da proporción mostral:

\(\hat p\to N\left ({p,} \sqrt{\dfrac{pq}{n}}\right )\)

Polo tanto, tipificando:

\(Z=\dfrac{\hat p-p}{\sqrt {\dfrac {pq}{n}}}\to N(0, 1)\)

Fixando un nivel de confianza, 1 - α, podemos calcular:

\(P\left(-z<\dfrac{\hat p-p}{\sqrt {\dfrac {pq}{n}}}<z\right)=1-α\)

Operando:

 \(P\left ({\hat p}-z{\sqrt {\dfrac {pq}{n}}}<p<{\hat p}+z{\sqrt {\dfrac {pq}{n}}}\right )=1-\alpha\)

que corresponde ao que queremos:

 \(P\left ({\hat p_1}<p<\hat p_2 \right)=1-α\)

Temos así calculado o intervalo de confianza (p̂1, p̂2), onde:

\({\hat p_1}={\hat p}-z{\sqrt {\dfrac {pq}{n}}}\)

\({\hat p_2}={\hat p}+z{\sqrt {\dfrac {pq}{n}}}\)

Polo tanto, chamando IC ao intervalo de confianza, queda do seguinte xeito:  \[IC =\left ({\hat p}-z{\sqrt {\dfrac {pq}{n}}}, {\hat p}+z{\sqrt {\dfrac {pq}{n}}}\right )=\left ({\hat p}{\pm}z{\sqrt {\dfrac {pq}{n}}}\right)\]

Para o seu cálculo teremos que atopar o valor z que se chama valor crítico e normalmente se denota por \(z_\dfrac{\alpha}{2}\) xa que o seu valor depende do nivel de significación, α.

Gráficamente:

Intervalo de confianza proporción
Intervalo de confianza proporción

IMPORTANTE

  • Na práctica, o intervalo anterior non é calculable (depende do valor descoñecido p). Para resolver o problema substitúese p polo seu estimador, \( \hat p \). O intervalo resultante é:
     \[IC =\left ({\hat p}-z_\frac {α} {2}{\sqrt {\dfrac {\hat{p} \hat{q}}{n}}}, {\hat p}+z_\frac {α} {2}{\sqrt {\dfrac {\hat{p} \hat{q}}{n}}}\right )=\left ({\hat p}{\pm}z_\frac {α} {2}{\sqrt {\dfrac {\hat{p} \hat{q}}{n}}}\right)\]
  • No caso dunha resposta dicotómica onde se descoñece p, só hai que especificar dous parámetros: o nivel de confianza (1 - α) e a semilonxitude do intervalo. Isto débese a que se asume a situación de máxima incerteza, onde p = 0,5. Entón \(p q = \frac 1 4 \) e o intervalo de confianza, na situación de máxima incerteza, é:
     \[IC =\left ({\hat p}-z_\frac {α} {2} {\sqrt {\dfrac {1}{4n}}}, {\hat p}+z_\frac {α} {2}{\sqrt {\dfrac {1}{4n}}}\right )=\left ({\hat p}{\pm}z_\frac {α} {2}{\sqrt {\dfrac {1}{4n}}}\right)\]

Exemplo

Queremos estimar a proporción de persoas na nosa cidade que teñen un can. Para iso, extraemos unha mostra aleatoria simple de 200 fogares, na que obtemos unha proporción de fogares con can do 53% . Calcula o intervalo de confianza do 99% para a proporción de habitantes que teñen un can.

Do enunciado obtemos que:

  • n = 200
  • \({\hat p}=0.53\) 
  • 1 - α = 0.99   \(\Rightarrow\) \( \frac {α} {2}\) = 0.005

Sabemos que  \[IC =\left ({\hat p}-z_\frac {α} {2}{\sqrt {\dfrac {\hat{p} \hat{q}}{n}}}, {\hat p}+z_\frac {α} {2}{\sqrt {\dfrac {\hat{p} \hat{q}}{n}}}\right )\]

Polo tanto, cos datos do enunciado:

 \[IC =\left ({0.53}-z_\frac {α} {2}{\sqrt {\dfrac {0.53(1-0.53)}{200}}}, 0.53+z_\frac {α} {2}{\sqrt {\dfrac {0.53(1-0.53}{200}}}\right )\]

Agora só nos queda calcular o valor crítico, \(z_\frac {α} {2}\), nas táboas da N(0, 1):

Cálculo valor crítico
Cálculo valor crítico

Como \(z_\frac {α} {2}\) = 2.58, teremos:
 \[IC =\left ({0.53}-2.58{\sqrt {\dfrac {0.53(1-0.53)}{200}}},0.53+2.58{\sqrt {\dfrac {0.53(1-0.53}{200}}}\right )= (0.439, 0.621)\] 

Temos unha confianza do 99% de que a portentaxe de fogares da nosa cidade que teñen can esté entre o 43.9% e o 62.1%.

Distribución binomial de parámetros n e p, onde n é o número de veces que se repite o experimento aleatorio, e p a proporción de "éxitos".

Aquela que só pode tomar dous valores. Neste caso, éxito ou fracaso.