4.1 Introdução à Estatística

Para aplicar a Ciência de Dados é essencial o uso da Estatística. Conforme Montgomery and Runger (2021), “Estatística é a ciência de dados”. Em um conjunto de dados, a estatística descritiva detalha e resume as suas principais características, de forma que permite maior entendimento do comportamento desse conjunto. Esse é um dos principais aspectos importantes para facilitar a interpretação e análise de dados em Data Science (Favero 2017; Montgomery and Runger 2021).

4.1.1 População e amostra

A População é um conjunto de observações relacionadas a indivíduos com uma característica em comum. Já a Amostra é um subconjunto da população, com uma parte das observações relacionadas à população. A partir da amostra realizam-se inferências sobre as características da população.

É importante que a amostra seja representativa para que os resultados não sejam deturpados.

4.1.2 Tipos de variáveis

Uma variável pode ser definida como uma característica da amostra ou população. Para aplicar os cálculos de estatísticas e realizar as representações gráficas é importante realizar a classificação da variável. Os tipos de variáveis são: Qualitativa ou não métrica e Quantitativa ou métrica. O primeiro tipo está relacionado com variáveis que categorizam os dados, de forma quenão seja possível medí-los ou realizar cálculos. Já o segundo, relaciona-se com variáveis que podem ser contadas ou mensuradas (Favero 2017).

Dentre as variáveis qualitativas, também chamada de variáveis categóricas, existem dois tipos: Nominal e Ordinal. Enquanto na Nominal não possível realizar nenhuma ordenação, na Ordinal existe uma ordem para os seus resultados. Para analisar essas variáveis podem ser utilizadas tabelas de distribuição de frequência e gráficos (Morettin and O. Bussab 2017; Favero 2017).

De forma similar, existem dois tipos para as variáveis quantitativas: Discreta e Contínua. As Discretas possuem valores inteiros, ou seja, não assumem valores decimais e, em sua maioria, resultam de uma contagem. Já as Contínuas possuem valores contidos nos números reais e resultam de uma mensuração. Podem ser analisadas a partir de medidas de posição, dispersão e forma (Morettin and O. Bussab 2017; Favero 2017).

References

Favero, Luiz P. 2017. Manual de Análise de Dados - Estatística e Modelagem Multivariada Com Excel®, SPSS® e Stata®. Grupo GEN. https://integrada.minhabiblioteca.com.br/#/books/9788595155602/.
Montgomery, Douglas C., and George C. Runger. 2021. Estatística Aplicada e Probabilidade Para Engenheiros. Grupo GEN. https://integrada.minhabiblioteca.com.br/#/books/9788521637448/.
Morettin, Pedro A, and Wilton de O. Bussab. 2017. Estatística Básica. Editora Saraiva. https://integrada.minhabiblioteca.com.br/#/books/9788547220228/.