3.3 Base de dados
Para realizar a leitura de uma base de dados, basta utilizar a função read()
. Exemplos de formatos de arquivo são .csv, .txt, .xlsx, entre outros. A forma mais comum de disponibilização de dados é o formato .csv
e a leitura dessa base de dados pode ser realizada conforme demonstrado abaixo.
dados <- read.csv("Data Science/dados.csv")
Note que o caminho escrito está pela metade, pois o diretório de trabalho já foi definido. Dessa forma, não é necessário escrever o caminho inteiro do arquivo “dados.csv”, por já estar localizado no diretório.
Para exploração dos dados, inicialmente algumas funções são úteis:
View()
para visualização dos dados .csv em uma tabela;Names()
para exibição dos nomes das variáveis presentes na base de dados;Summary()
para a realização de um sumário de estatísticas para as variáveis numéricas da base de dados (mínimo, máximo, mediana, média, 1º quartil, 3º quartil e número de NAs).