O Teste T de Amostra Única é calculado para testar se o valor empírico difere significativamente do valor verdadeiro \(\mu\). Portanto, você precisa ter conhecimento sobre \(\mu\).
Suponha que o órgão de estatísticas tenha indicado a idade média oficial como \(36.8\) anos.
Qual valor a média aritmética da idade em nosso conjunto de dados assume?
A variável de idade é chamada agea
.
Calcule a média aritmética da idade no conjunto de dados PSS!
mean(
pss$agea,
na.rm = TRUE
)
No conjunto de dados, a idade média é de (42.83006) anos. Portanto, o valor difere no conjunto de dados.
Agora, a tradução para o português brasileiro:
Agora você quer testar se essa discrepância é estatisticamente significativa. Para isso, em cada comparação de médias, existem duas situações de teste:
bilateral
unilateral (maior ou menor)
Você quer apenas saber se o valor difere significativamente. Não há suposição sobre a direção. Portanto, você realiza um teste bilateral.
Você pode fazer isso com a função t.test()
:
t.test(
pss$agea,
mu = 36.8,
alternative = "two.sided"
)
##
## One Sample t-test
##
## data: pss$agea
## t = 31.273, df = 4842, p-value < 2.2e-16
## alternative hypothesis: true mean is not equal to 36.8
## 95 percent confidence interval:
## 42.45205 43.20808
## sample estimates:
## mean of x
## 42.83006
Então você verá o valor-t, o valor-p, o intervalo de confiança e a média.
O valor-p é menor que \(0.05\) e, portanto, você obtém um resultado de teste significativo. O valor exibido é 2.2e-16
. Isso significa simplesmente 2.2*10^{-16}
, indicando que você precisa mover a vírgula 16 casas para a esquerda. Portanto, é um valor muito próximo de \(0\). Você pode concluir que a média de idade da amostra difere significativamente de \(\mu\). Já discutimos as possíveis razões para isso anteriormente!
Você também pode calcular a diferença usando R:
diff_idade <- mean(pss$agea, na.rm = TRUE) - 36.8
diff_idade
## [1] 6.030064
A diferença é de \(6.030064\). Como \(\mu\) se refere a todas as pessoas em Panem e a amostra inclui apenas pessoas a partir de \(16\) anos, essa diferença é facilmente explicável.
Também é possível realizar um teste unilateral:
se assumirmos que o valor é maior que \(\mu\) greater
se assumirmos que o valor é menor que \(\mu\) less
.
# one-sided, greater
t.test(
pss$agea,
mu = 36.8,
alternative = "greater"
)
##
## One Sample t-test
##
## data: pss$agea
## t = 31.273, df = 4842, p-value < 2.2e-16
## alternative hypothesis: true mean is greater than 36.8
## 95 percent confidence interval:
## 42.51284 Inf
## sample estimates:
## mean of x
## 42.83006
# one-sided, lower
t.test(
pss$agea,
mu = 36.8,
alternative = "less"
)
##
## One Sample t-test
##
## data: pss$agea
## t = 31.273, df = 4842, p-value = 1
## alternative hypothesis: true mean is less than 36.8
## 95 percent confidence interval:
## -Inf 43.14729
## sample estimates:
## mean of x
## 42.83006
Vamos agora para o teste t de duas amostras!