Medidas de centralización e medidas de posición.
Tes que saber.
Ata agora vimos como se poden resumir os datos obtidos do noso estudo en táboas estatísticas ou en gráficos. Agora temos que calcular uns valores que nos ofrecen información máis precisa e sexan representativos dos valores que obtivemos no estudo estatístico.
Estes valores que describen a nosa poboación (medidas descritivas) chámanse parámetros e poden ser:
- Parámetros de centralización ou posición.
- Parámetros de dispersión.
Os parámetros de centralización pretenden resumir o conxunto de todos os valores obtidos, nun único número que representa o valor ao redor do que se distribúen todos os datos e son:
- Media.
- Mediana.
- Moda.
A Media dun conxunto de datos é o resultado da división da suma de todos os datos entre o número de datos que temos.
A media representa o valor central en torno ao que se distribúen todos os valores do caracter. Se os valores están agrupados en intervalos de clase, o cálculo faise coas marcas de clase.
Só se pode calcular a media se os caracteres son cuantitativos.
A mediana é o valor que está no centro da distribución despois de ter ordenados os datos, é dicir, hai o mesmo número de datos menores cá mediana que maiores ca ela.
Para calcular a mediana ordenamos os datos de menor a maior e collemos o valor que queda no centro. Se o número de datos é impar claramente un deles divide en dúas partes iguais o conxunto de valores se, pola contra, o número de valores é par, o que temos que facer é a media aritmética dos dous valores centrais.
Cando os datos están resumidos nunha táboa para calcular a mediana, buscamos o primeiro valor cuxa frecuencia acumulada supera a metade do número de datos.
Se os datos están agrupados en intervalos de clase, o que buscamos é o intervalo mediano que é a clase que contén o primeiro valor cuxa frecuencia acumulada supera a metade do número de datos.
Por último chamamos Moda ao valor que ten maior frecuencia, se os datos están agrupados, o intervalo de clase que contén o valor de maior frecuencia é o intervalo modal.
A moda pódese calcular tanto para datos cuantitativos como cualitativos.
Que pasa cando hai máis dun dato que ten frecuencia máxima?
Exemplos
Usaremos os exemplos da páxina anterior para calcular os parámetros de centralización:
Preguntamos o número de días á semana que consumían refrescos 30 personas e obtivemos os seguintes resultados:
Completamos a táboa de frecuencias e calculamos os parámetros:
Media
Os produtos dos valores que toma a variable polas súas respectivas frecuencias fixémolo na terceira columna e a súa suma dá 73, polo tanto:
Mediana Para calcular a mediana primeiro calculamos canto é a metade do número de datos, neste caso temos 30 datos que dividido entre 2 dá 15.
Buscamos na columna das frecuencias acumuladas a primeira que pase de 15, entón a mediana é o valor de xi ao que lle corresponde esa frecuencia acumulada, neste caso:
Me= 2
Moda Buscamos cal dos valores da nosa variable ten maior frecuencia, neste caso:
Mo = 4
Vexamos agora un exemplo de como se calcularían estes parámetros canto temos agrupados os datos en intervalos de clase partindo do exemplo dos refrescos. Neste caso preguntamos que cantidade de refresco consumían diariamente e despois de organizar os datos obtivemos a seguinte táboa:
Completamos agora a táboa coas columnas necesarias para calcular os parámetros de centralización.
Calculamos a media: neste caso os valores xi son as marcas de clase polo que:
Clase mediana: buscamos o primeiro valor da frecuencia absoluta acumulada que sexa maior que 15, mirando na última columna topamos que é 20, polo que:
Clase mediana = [200,400)
Clase modal: buscamos o intervalo que contén os valores con maior frecuencia.
Clase modal= [200,400)
Que aprendiches?
Preguntamos a 30 persoas o número de veces que foron a unha biblioteca na última semana e obtivemos as seguintes respostas:
Calcula a media a mediana e a moda.
Que aprendiches?
Preguntámoslle a 250 alumnos/as canto tempo, en minutos, lles leva chegar ao instituto dende as súas respectivas casas e obtivemos:
Calcula a media, a clase modal e a clase mediana.
Tes que saber.
Até aquí estudamos como achar os parámetros centrais en torno aos que se distribúen os valores que toman as variables que estamos a estudar dunha poboación. Veremos agora outros parámetros de posición que reparten os datos en varias partes iguais, chámanse cuantiles e segundo o número de partes en que queda dividida a nosa poboación poden ser os percentís, decís ou cuartís. Este curso estudarás estes últimos.
Os cuartís son tres valores que dividen o conxunto dos datos en catro partes iguais. Represéntanse por Q1,Q2 e Q3 .
- Q1: é o valor da variable tal que a cuarta parte dos datos son menores ca el.
- Q2: é o valor da variable tal que a metade dos datos son menores ca el e a outra metade, loxicamente, son maiores ca el. Fíxate que este parámetro coincide coa mediana.
- Q3: é o valor da variable tal que as 3/4 partes dos valores da variable son menores ca el.
Para calcular estes parámetros procedemos de xeito similar a como o fixemos para calcular a mediana:
- Se os datos non están agrupados ordenámolos de menor a maior, Q1 será o dato que deixe por baixo a cuarta parte dos datos, Q2 deixa a metade e Q3 os 3/4 dos datos.
- Se os datos están ordenados en táboas de frecuencias de datos aislados, daquela procédese do seguinte xeito:
- Q1: buscamos o primeiro valor cuxa frecuencia absoluta acumulada sexa maior que 1/4 do número total de datos.
- Q2: este valor será o primeiro cuxa frecuencia acumulada supere a metade do número de datos.
- Q3 será o primeiro valor cuxa frecuencia absoluta acumulada supere os 3/4 do total do número de datos.
- Se os datos están agrupados en intervalos procedemos igual que no caso anterior e obtemos a clase onde están os respectivos cuartís. En cursos posteriores aprenderás a calcular de xeito máis preciso isto.
Exemplos
Usaremos os exemplos anteriores para ilustrar como se calculan os cuartís.
Para o número de días na semana que consumían refrescos os individuos da nosa poboación obtiveramos a seguinte táboa de frecuencias:
Calculamos as clases que conteñen os cuartís:
Q1: A cuarta parte dos datos é 30:4=7,5, entón buscamos o dato cuxa frecuencia acumulada supere o 7,5 e temos:
Q1=1
Q2: a metade dos datos é 30:2=15 o primeiro valor da frecuencia acumulada maior que 15 é 16 e correspóndelle ao valor 2, entón:
Q2=2
Q3: os 3/4 dos datos é 30·3/4= 22,5 e a primeira frecuencia acumulada maior que 22,5 é 26 que lle corresponde ao valor 4, polo tanto:
Q3=4
Vexamos agora como se fai no caso de datos agrupados en intervalos de clases:
Calculamos os cuartís:
Q1: A cuarta parte dos datos é 30:4=7,5, entón buscamos o dato cuxa frecuencia acumulada supere o 7,5 e temos que lle corresponde ao intervalo:
[0,200)
Q2: a metade dos datos é 30:2=15 o primeiro valor da frecuencia acumulada maior que 15 é 16 e correspóndelle ao intervalo:
[200,400)
Q3: os 3/4 dos datos é 30·3/4= 22,5 e a primeira frecuencia acumulada maior que 22,5 é 26 que lle corresponde ao intervalo:
[400,600)
Que aprendiches?
Calcula os cuartís ou intervalos que os conteñen nos exercicios que che propuxemos antes.
Avaliación.
As tarefas que farás neste apartado avaliaranse segundo os estándares recollidos no bloque MAB5.1.2. da seguinte rúbrica.
Licenciado baixo a Licenza Creative Commons Recoñecemento Non-comercial Compartir igual 4.0