Tabelas

Antes de calcular medidas de associação, você primeiro irá criar tabelas. Isso é às vezes relevante para a representação gráfica. Muitas vezes, tabelas que exibem frequências de variáveis são escolhidas para representação. Para uma tabela simples (de frequência), chamamos a função table():

table(pss$stfdem)
## 
##   0   1   2   3   4   5   6   7   8   9  10 
## 226 268 436 618 754 850 631 522 338 179  83

A primeira linha contém os valores de código, a segunda as frequências. Listados aqui estão os casos válidos, ou seja, de cada valor que não está definido como NA.

Quantos casos válidos temos? Quantos NA’s?

Para testar isso, usamos as funções sum() e length():

# gültige Fälle aus der Tabelle
sum(
  table(
    pss$stfdem
  )
) 
## [1] 4905
# Summe der NA's
sum(
  is.na(
    pss$stfdem
  )
)
## [1] 95
# Gesamtlänge: Gültige Fälle + NA's
length(pss$stfdem)
## [1] 5000

Alternativamente, a função table() pode ser expandida com o argumento useNA = "ifany":

table(
  pss$stfdem,
  useNA = "ifany"
)
## 
##    0    1    2    3    4    5    6    7    8    9   10 <NA> 
##  226  268  436  618  754  850  631  522  338  179   83   95

Tabela com a biblioteca summarytools

Para obter uma saída estruturada, a biblioteca summarytools pode ser utilizada. Você obterá uma visualização semelhante ao SPSS. A biblioteca deve ser instalada e carregada primeiro:

install.packages("summarytools")
library("summarytools")

Dann wird die Funktion freq() genutzt:

freq(pss$stfdem)
## Frequencies  
## pss$stfdem  
## Type: Numeric  
## 
##               Freq   % Valid   % Valid Cum.   % Total   % Total Cum.
## ----------- ------ --------- -------------- --------- --------------
##           0    226      4.61           4.61      4.52           4.52
##           1    268      5.46          10.07      5.36           9.88
##           2    436      8.89          18.96      8.72          18.60
##           3    618     12.60          31.56     12.36          30.96
##           4    754     15.37          46.93     15.08          46.04
##           5    850     17.33          64.26     17.00          63.04
##           6    631     12.86          77.13     12.62          75.66
##           7    522     10.64          87.77     10.44          86.10
##           8    338      6.89          94.66      6.76          92.86
##           9    179      3.65          98.31      3.58          96.44
##          10     83      1.69         100.00      1.66          98.10
##        <NA>     95                               1.90         100.00
##       Total   5000    100.00         100.00    100.00         100.00

Na primeira coluna estão os valores de código. Na segunda estão as frequências, na terceira os percentuais (dos casos válidos) e na quarta coluna os percentuais cumulativos (dos casos válidos). As colunas \(5\) e \(6\) mostram os percentuais e os percentuais cumulativos de todos os casos (incluindo NA's).

No próximo passo, você aprenderá sobre tabelas cruzadas!