Os dois conjuntos de dados a seguir mostram dados que não estão organizados. Vamos limpá-los a seguir.
statclass
## name stat1 stat2 r spss
## 1 momo 12 5 6 9
## 2 kim 14 10 13 15
## 3 sascha 7 4 4 1
Este conjunto de dados está no formato wide. Ou seja, se tivéssemos novos exames, simplesmente adicionaríamos mais colunas. No entanto, isso pode ser problemático para processamento com R, pois muitas vezes precisamos de um formato long.
statclass2
Neste caso, temos vários problemas: Em algumas colunas, não temos variáveis, mas observações (momo
, kim
, sascha
) e na coluna exam
, encontramos nomes de variáveis novamente.
Vamos começar com statclass
.
```