É importante para o processamento de dados que os conjuntos de dados sejam tidy, para que as funções em R possam operar sem problemas com os dados. Isso significa que os dados devem estar em um formato específico para que as funções em R funcionem bem com os dados (menos troubleshooting).
Um conjunto de dados é sempre uma coleção de valores, seja numérico ou uma string. Esses valores são sempre organizados de duas maneiras: Cada valor pertence a uma Variável e a uma Observação. Uma Variável inclui todos os valores que foram medidos para ela (ou seja, todas as observações nessa variável). Uma Observação inclui todos os valores que foram medidos para essa observação (ou seja, todos os valores das variáveis dessa unidade).
Para que os dados possam ser bem utilizados com as funções em R, eles devem estar em um formato tidy (também conhecido como formato long). Um conjunto de dados é considerado tidy quando …