Supoñamos unha poboación da que coñecemos a proporción, p, de individuos que cumpren unha determinada característica. Consideramos a variable aleatoria \(X \to {B(n, p)}\), onde p é a proporción de "éxitos" na poboación.
Para tamaños grandes de n, n > 30, a distribución Binomial achégase a distribución normal de parámetros:
\(X \to {N(np,} \sqrt{npq}{)}\)
Se desta poboación extraemos mostras de tamaño n, e en cada mostra estudamos á súa vez a proporción de individuos que cumpren a característica estudada, obteremos diferentes proporcións mostrais. Definimos o estatístico proporción mostral:
\(\hat p=\dfrac{X}{n}\)
É unha variable aleatoria formada polos diferentes valores que toman as proporcións das mostras. Esta variable aleatoria como tal ten as seguintes características:
- A media ou esperanza matemática da variable proporción mostral é a proporción da poboación p
- A desviación típica da variable proporción mostral é \(\sqrt {\dfrac {pq}{n}}\).
É dicir, verifica:
\(\hat p\to N\left ({p,} \sqrt{\dfrac{pq}{n}}\right )\)
Polo tanto, tipificando:
\(Z=\dfrac{\hat p-p}{\sqrt {\dfrac {pq}{n}}}\to N(0, 1)\)