Conjuntos de Dados Desorganizados

Os dois conjuntos de dados a seguir mostram dados que não estão organizados. Vamos limpá-los a seguir.

statclass
##     name stat1 stat2  r spss
## 1   momo    12     5  6    9
## 2    kim    14    10 13   15
## 3 sascha     7     4  4    1

Este conjunto de dados está no formato wide. Ou seja, se tivéssemos novos exames, simplesmente adicionaríamos mais colunas. No entanto, isso pode ser problemático para processamento com R, pois muitas vezes precisamos de um formato long.

statclass2

Neste caso, temos vários problemas: Em algumas colunas, não temos variáveis, mas observações (momo, kim, sascha) e na coluna exam, encontramos nomes de variáveis novamente.

Vamos começar com statclass. ```