Saltar navegación

Software estatístico

Minitab, SPSS, SAS, STATA e MATLAB

Son paquetes específicos para análise de datos, cálculo de probabilidades e inferencia estatística. O software estatístico, como MinitabSPSS, SAS, STATA ou MATLAB, ofrece ferramentas avanzadas para o cálculo e análise de probabilidade. Permítennos realizar simulacións, calcular intervalos de confianza e realizar inferencias estatísticas.

  • Minitab é un software estatístico integrado deseñado para realizar análises estatísticas de forma sinxela e visual. Algunhas das súas principais características son:
    • Interfaz gráfica intuitiva e amigable para usuarios non expertos en programación.
    • Ampla gama de ferramentas estatísticas, como estatísticos descritivos, probas de hipóteses, análise de regresión, deseño de experimentos, control estatístico de procesos, etc.
    • Asistentes e guías que axudan a seleccionar a análise apropiada e interpretar os resultados.
    • Capacidade para importar e exportar datos desde diferentes formatos como Excel, texto, bases de datos, etc.
    • Dispoñible para Windows, Mac e algunhas distribucións de Linux.
    • Moi utilizado en ámbitos como a industria, educación, investigación de operacións, control de calidade, etc.

Minitab destaca pola súa facilidade de uso e por ofrecer unha solución estatística completa, aínda que ten menos flexibilidade que software baseado en linguaxes de programación como R ou Python.

  • SPSS (Statistical Package for the Social Sciences) é un software estatístico amplamente utilizado, especialmente nas ciencias sociais e do comportamento. Algunhas das súas principais características son:
    • Ofrece unha gran variedade de técnicas estatísticas, como estatística descritiva, análise de frecuencias, comparación de medias, modelos lineais, análise multivariante, etc.
    • Permite xestionar e analizar bases de datos de diferentes formatos (Excel, texto, bases de datos, etc.)
    • Inclúe ferramentas para a creación de gráficos e visualizacións de datos.
    • Conta cunha interface gráfica de usuario intuitiva que facilita o seu uso sen necesidade de programación.
    • Xera informes e saídas ben formateadas e listas para incluír en documentos.
    • Soporta a creación de ficheiros de sintaxe para reproducir análises.
    • É moi popular en ámbitos como investigación de mercados, saúde, educación, goberno, etc.

SPSS destaca pola súa facilidade de uso, ampla gama de técnicas estatísticas e boa capacidade para xestionar datos. Non obstante, require licenzas comerciais e ten menos flexibilidade que software baseado en linguaxes de programación coma Python ou R.

  • STATA é un software estatístico integrado desenvolvido por StataCorp, amplamente utilizado en investigación académica, gobernos, consultorías e empresas. Permite xestionar, analizar e visualizar datos de xeito sinxelo e eficiente. Algunhas das súas principais características son:
    • Permite realizar unha gran variedade de análises estatísticas, como estatística descritiva, modelos lineais, series temporais, análise de supervivencia, econometría, etc.
    • Posúe unha linguaxe de programación propia que permite automatizar tarefas e personalizar análises.
    • Xestiona de forma eficiente grandes bases de datos e permite importar/exportar datos en diferentes formatos.
    • Ofrece unha ampla variedade de opcións gráficas para visualizar resultados.
    • Dispoñible para Windows, Mac e Unix/Linux.
    • Conta cunha interface gráfica sinxela, pero tamén se pode usar mediante liña de comandos.
    • Existe unha gran cantidade de módulos e paquetes adicionais desenvolvidos por usuarios.

Stata destaca pola súa robustez, precisión nos cálculos e ampla gama de técnicas estatísticas implementadas. É moi popular en disciplinas como economía, epidemioloxía, socioloxía, ciencias políticas, etc.

  • SAS (Statistical Analysis System) é un software integrado para xestión e análise de datos desenvolvido por SAS Institute. Algunhas das súas principais características son:
    • Ofrece unha ampla gama de ferramentas estatísticas, desde estatística descritiva ata técnicas avanzadas como minería de datos, aprendizaxe automática, series temporais, etc.
    • Conta cunha linguaxe de programación propia (tamén chamada SAS) deseñada especificamente para traballar con datos.
    • Permite xestionar e analizar grandes volumes de datos estruturados e non estruturados de forma eficiente.
    • Inclúe capacidades de visualización de datos e creación de informes.
    • Cumpre con estándares de seguridade e privacidade de datos.
    • É moi utilizado en empresas, gobernos, institucións financeiras e de investigación de mercados.
    • Ademais de análise estatística, SAS tamén ofrece módulos para outras tarefas como xestión de calidade, intelixencia de negocio, xestión do ciclo de vida analítico, etc.

SAS destaca pola súa posibilidade de manexar grandes volumes de datos, ampla funcionalidade e solidez. Non obstante, require licenzas comerciais que poden resultar caras para uso individual ou académico.

  • MATLAB (abreviatura de "MATrix LABoratory") é un software de computación numérica e linguaxe de programación desenvolvido por MathWorks. Algunhas das súas principais características son:
    • Deseñado especificamente para realizar cálculos numéricos con matrices e vectores de forma eficiente.
    • Contén unha ampla biblioteca de funcións matemáticas, de procesamento de sinais, optimización, estatística, etc.
    • Permite crear gráficos e visualizacións de datos de alta calidade.
    • Combina un entorno de programación con unha interface gráfica de usuario.
    • Moi utilizado en enxeñaría, ciencias, finanzas e educación para modelado, simulación, prototipado, análise de datos, etc.
    • Posúe ferramentas adicionais como Simulink (para modelado e simulación de sistemas) e GUIDE (para deseñar interfaces gráficas).
    • Soporta programación paralela e computación en GPU para acelerar cálculos.
    • Permite intercambiar datos con outros software como C, C++, Fortran, Java, etc.

MATLAB destaca pola súa versatilidade, rendemento e ampla gama de ferramentas, aínda que require licenza de pago para uso profesional.

Exemplos con SPSS

Para levar a cabo calquera cálculo con funcións, SPSS proporciona unha calculadora, que se activa pulsando na barra de menús:

Transformar > Calcular

Nota: Antes de proceder a calquera cálculo, é preciso que haxa algún ficheiro de datos aberto no Editor de datos. Se non o hai, na Vista de datos colocamos algúns valores nas celas. Non é necesario que estes valores utilícense nos c´alculos, aínda que podr´ıa facerse, pero a súa presenza é imprescindible para que poida funcionar a calculadora.

No cadro de diálogo Calcular variable que aparece, hai que escribir nos campos:

Variable de destino: o nome da variable na que se almacenará o resultado. 
Expresión numérica: colocamos a expresión, formada por nomes de funcións, signos de operacións, números e nomes de variables, cuxo valor desexamos calcular.

Distribucións discretas

  1. Abrir unha nova xanela de sintaxe: Ficheiro > Nova > Sintaxe
  2. Utilizar a función correspondente da seguinte lista:
  • Binomial

CDF.BINOM(x, n, p): Acha o valor da función de distribución no punto x dunha variable aleatoria binomial de parámetros n e p. 

  • Poisson

CDF.POISSON(x, λ): Acha o valor da función de distribución no punto x dunha variable aleatoria de Poisson de parámetro λ.

  • Uniforme

CDF.UNIFORM(x, a, b): Acha o valor da función de distribución no punto x dunha variable aleatoria uniforme no intervalo [a,b].

Exemplo Binomial

Se \(X \sim B(10, 0.2)\)

1. \(P(X=3)\)

a. No SPSS, ir a :

Ficheiro > Nova > Sintaxe

b. Escribir:

COMPUTE Prob_Igual3 = PDF.BINOM(3, 10, 0.2).

c. Seleccionar Ejecutar

Isto creará unha nova variable chamada Prob_Igual3 co valor da probabilidade de obter exactamente 3 éxitos.

Resultado: 0.201

2. \(P(x \leq 3)\)

a. No SPSS, ir a:

Ficheiro > Nova > Sintaxe

b. Escribir:

COMPUTE Prob_MenorIgual3 = CDF.BINOM(3, 10, 0.2).

c. Seleccionar Ejecutar

Isto calculará a probabilidade acumulada de obter 3 ou menos éxitos e gardará o resultado nunha nova variable chamada Prob_MenorIgual3.

Resultado:  0.88

Distribucións continuas

  1. Abrir unha nova xanela de sintaxe: Ficheiro > Nova > Sintaxe
  2. Utilizar a función correspondente da seguinte lista:
  • N(0, 1)

CDFNORM(z): Acha o valor da función de distribución no punto z dunha variable aleatoria normal de parámetros 0 e 1.

  • N(μ, σ)

CDF.NORMAL(x, µ, σ): Acha o valor da función de distribución no punto x dunha variable aleatoria normal de parámetros µ e σ.

  • Exponencial

CDF.EXP(x, λ): Acha o valor da función de distribución no punto x dunha variable aleatoria exponencial de parámetro λ.

Exemplos Normal

1. \(P(x \leq 3)\) nunha N(0, 1)

a. No SPSS, ir a:

Ficheiro > Nova > Sintaxe

b. Escribir:

COMPUTE Prob_MenorIgual2_13 = CDF.NORM(2.13).

c. Seleccionar Ejecutar.

A nova variable Prob_MenorIgual2_13 terá o valor da probabilidade buscada. Para ver este valor, ir a Ver > Datos.

Resultado: 0.98

2. \(P(x \leq 35)\) nunha N(30, 4)

a. No SPSS, ir a:

Ficheiro > Nova > Sintaxe

b. Escribir:

COMPUTE Prob_MenorIgual35 = CDF.NORMAL(35, 30, 4).

c. Seleccionar Ejecutar.

A nova variable Prob_MenorIgual35 terá o valor da probabilidade buscada. Para ver este valor, ir a Ver > Datos.

Resultado: 0.89

Feito con eXeLearning (Nova xanela)