¿Cuál es tu burbuja?
Colores y edades

En este mapa de burbujas el azul representa juventud y el marrón, envejecimiento.
Además, el tamaño de las burbujas representa el tamaño de la población.
¿Cómo son las burbujas gallegas? Grandes en la costa, pequeñas en el interior.
Como los tamaños y los colores varían tanto, se dice que hay mucha dispersión.
La forma de medirla, en estadística, es usando las medidas de dispersión.
La más sencilla es el rango (o recorrido), que es la diferencia entre el valor máximo y el mínimo.
Por ejemplo, al estudiar las edades en el pueblo de la montaña lucense, viste que había un valor mínimo (85 años) y uno máximo (102 años). El rango es: 102 - 85 = 17 años.
El recorrido intercuartílico, RI = Q3 - Q1, también es una medida de dispersión.
\(x - \bar{x}\)
Imagina que tu ayuntamiento tiene un dinero para invertir en un edificio y se plantea si hará un centro de atención temprana o uno para la tercera edad.
Con los datos del censo han calculado que la media de edad del municipio es de 50 años. ¿Crees que este valor es suficiente para decidir?
La respuesta es no, dado que la medida de 50 podría obtenerse de edades muy diferentes. Por ejemplo, una persona con 1 año y otra con 99 años.
La forma más fácil de analizar las edades del municipio es calcular sus diferencias respecto a la media de 50 años.
Al resultado de cada una de estas diferencias, \(x - \bar{x}\), se les llama "desviación".
\(|x - \bar{x}|\)
El resumen de esas restas (desviaciones) se calcula haciendo su media.
Para que no se compensen resultados positivos y negativos, previamente se les hace el valor absoluto.
A esta medida de dispersión se le llama desviación absoluta media o, abreviadamente, desviación media.
Para calcularla hay que hacer los siguientes pasos:
1. Hallar la media de los datos.
2. Restar cada uno de los datos a la media y hacer el valor absoluto del resultado.
3. Hacer la media de estos valores absolutos.
La desviación absoluta media es la media de los valores absolutos de las desviaciones con respecto a la media.
\(D_{m}= \frac{\displaystyle \sum_{i=1}^{n}\left|x_{i}-\bar{x}\right|\cdot f_{i}}{N}\)
\(x - \bar{x}^2\)
Para evitar que se compensen los resultados positivos y negativos al restar, otra opción es elevar al cuadrado.
La media de esos cuadrados se llama varianza.
Se representa como Var o σ2.
Para calcularla hay que hacer los siguientes pasos:
- Hallar la media de los datos a analizar.
- Restar cada uno de los datos a la media y hacer el cuadrado del resultado.
- Hacer la media de estos cuadrados.
En resumen, consiste en calcular la media de los cuadrados de las desviaciones con respecto a la media.
\(\sigma^2=\dfrac{\displaystyle \sum_{i=1}^{n} (x_{i}-\bar{x})^2\cdot f_{i}}{N}\)
σ
Como la varianza da como resultado la medida original al cuadrado (en el ejemplo, años al cuadrado), una forma de evitarlo es hacer su raíz cuadrada, obteniendo así la desviación típica o desviación estándar.
La desviación típica, que se representa con la letra griega \(\sigma\), es la raíz cuadrada de la varianza.
\(\sigma =\sqrt{Var}\)
CV
Finalmente, el ayuntamiento decide estudiar la edad por zonas.
En la zona A, la media es 20 años y la desviación típica es 10 años.
En la zona B, la media es 70 años, pero la desviación típica es de 14 años.
Para compararlas se hace la razón entre la desviación típica y la media: es el coeficiente de variación.
\(\dfrac{10 }{20}\) = 0,5 se compara con \(\dfrac{14 }{70}\) = 0,2
En la zona A hay una variación alta, del 50 %, mientras que en la B hay una variación menor, del 20 %.
Esto puede ayudar a tomar decisiones sobre la ubicación de los centros educativos, residencias...
Observa que el coeficiente de variación, CV, es una medida de dispersión relativa. Esto significa que no tiene unidades.
Ayuda a comparar dos conjuntos de datos que no tienen la misma media.
El coeficiente de variación es el cociente de la desviación típica entre la media, es decir:
\(CV=\frac{\sigma }{\bar{x}}\)
Observa que, si la media es 0, no se puede calcular.