3.3 Base de dados

Para realizar a leitura de uma base de dados, basta utilizar a função read(). Exemplos de formatos de arquivo são .csv, .txt, .xlsx, entre outros. A forma mais comum de disponibilização de dados é o formato .csv e a leitura dessa base de dados pode ser realizada conforme demonstrado abaixo.

dados <- read.csv("Data Science/dados.csv")

Note que o caminho escrito está pela metade, pois o diretório de trabalho já foi definido. Dessa forma, não é necessário escrever o caminho inteiro do arquivo “dados.csv”, por já estar localizado no diretório.

Para exploração dos dados, inicialmente algumas funções são úteis:

  1. View() para visualização dos dados .csv em uma tabela;
  2. Names() para exibição dos nomes das variáveis presentes na base de dados;
  3. Summary() para a realização de um sumário de estatísticas para as variáveis numéricas da base de dados (mínimo, máximo, mediana, média, 1º quartil, 3º quartil e número de NAs).