Teste T de Amostra Única

O Teste T de Amostra Única é calculado para testar se o valor empírico difere significativamente do valor verdadeiro \(\mu\). Portanto, você precisa ter conhecimento sobre \(\mu\).

Suponha que o órgão de estatísticas tenha indicado a idade média oficial como \(36.8\) anos.

Qual valor a média aritmética da idade em nosso conjunto de dados assume? A variável de idade é chamada agea.

Calcule a média aritmética da idade no conjunto de dados PSS!

mean(
pss$agea,
na.rm = TRUE
)

No conjunto de dados, a idade média é de (42.83006) anos. Portanto, o valor difere no conjunto de dados.

Pense rapidamente por que o valor pode diferir no conjunto de dados!

Agora, a tradução para o português brasileiro:


Agora você quer testar se essa discrepância é estatisticamente significativa. Para isso, em cada comparação de médias, existem duas situações de teste:

  • bilateral

  • unilateral (maior ou menor)

Você quer apenas saber se o valor difere significativamente. Não há suposição sobre a direção. Portanto, você realiza um teste bilateral.

Você pode fazer isso com a função t.test():

t.test(
  pss$agea, 
  mu = 36.8,
  alternative = "two.sided"
)  
## 
## 	One Sample t-test
## 
## data:  pss$agea
## t = 31.273, df = 4842, p-value < 2.2e-16
## alternative hypothesis: true mean is not equal to 36.8
## 95 percent confidence interval:
##  42.45205 43.20808
## sample estimates:
## mean of x 
##  42.83006

Então você verá o valor-t, o valor-p, o intervalo de confiança e a média.

O valor-p é menor que \(0.05\) e, portanto, você obtém um resultado de teste significativo. O valor exibido é 2.2e-16. Isso significa simplesmente 2.2*10^{-16}, indicando que você precisa mover a vírgula 16 casas para a esquerda. Portanto, é um valor muito próximo de \(0\). Você pode concluir que a média de idade da amostra difere significativamente de \(\mu\). Já discutimos as possíveis razões para isso anteriormente!

Você também pode calcular a diferença usando R:

diff_idade <- mean(pss$agea, na.rm = TRUE) - 36.8

diff_idade
## [1] 6.030064

A diferença é de \(6.030064\). Como \(\mu\) se refere a todas as pessoas em Panem e a amostra inclui apenas pessoas a partir de \(16\) anos, essa diferença é facilmente explicável.

Alternativas de Teste

Também é possível realizar um teste unilateral:

  • se assumirmos que o valor é maior que \(\mu\) greater

  • se assumirmos que o valor é menor que \(\mu\) less.

# one-sided, greater
t.test(
  pss$agea, 
  mu = 36.8, 
  alternative = "greater"
)
## 
## 	One Sample t-test
## 
## data:  pss$agea
## t = 31.273, df = 4842, p-value < 2.2e-16
## alternative hypothesis: true mean is greater than 36.8
## 95 percent confidence interval:
##  42.51284      Inf
## sample estimates:
## mean of x 
##  42.83006
# one-sided, lower
t.test(
  pss$agea,
  mu = 36.8, 
  alternative = "less"
)
## 
## 	One Sample t-test
## 
## data:  pss$agea
## t = 31.273, df = 4842, p-value = 1
## alternative hypothesis: true mean is less than 36.8
## 95 percent confidence interval:
##      -Inf 43.14729
## sample estimates:
## mean of x 
##  42.83006

Vamos agora para o teste t de duas amostras!