4.3 Representação gráfica

Como a representação gráfica de variáveis qualitativas está associada às frequências associadas às categorias, os gráficos mais utilizados são de barras e de composição em setores (gráfico de pizza ou retângulos). Em um gráfico de barras, visualiza-se a tabela de frequências de forma que as categorias apresentam-se no eixo x e, a frequência absoluta ou relativa, no eixo y. É possível que os eixos estejam invertidos, ou seja, no eixo x apresentam-se as frequências e, no eixo y, as categorias. Já os gráficos de composição de setores podem apresentar a contagem de ocorrências das categorias de uma variável e também em relação ao seu total de contagens, ou seja, respectivamente as frequências absolutas e relativas das categorias da variável(Morettin and O. Bussab 2017; Bruce and Bruce 2019).

As representações gráficas para viariáveis quantitativas apresentam maior variedade, porque, além dos gráficos usados para variáveis qualitativas, ainda é possível realizar gráficos de linhas, de dispersão, histogramas, de ramo-e-folhas e box-plots (Morettin and O. Bussab 2017; Favero 2017).

A representação gráfica de pontos formados pela intersecção no eixo x e y ligados por uma linha reta é o gráfico de linhas. Conforme apresentado por Favero (2017), esse gráfico poderá representar o comportamento de somente uma variável. Os valores numéricos da variável apresentam-se no eixo y e o eixo x apresenta a distribuição dos dados uniformemente ao longo do tempo. Portanto, a partir dessa representação é possível visualizar a evolução (ou tendência) dos dados da variável (Favero 2017). O gráfico de dispersão é muito semelhante ao de linhas, porém, nesse caso, os pontos não são ligados por uma reta. Além disso, os intervalos de distribuição dos dados, normalmente, são irregulares. Existe a possibilidade de utilizar essa representação para duas variáveis simultaneamente (Favero 2017).

Segundo Morettin and O. Bussab (2017), um gráfico de barras contíguas é um histograma. Os valores da variável apresentam-se no eixo x e a distribuição de frequências no eixo y. Como a área de cada retângulo é proporcional à respectiva frequência, a área total do histograma sempre será igual a um. Portanto, a primeira etapa para a construção de um histograma é a construção da tabela de frequências, calculando as frequências absoluta e relativa e suas respectivas frequências acumuladas. Além disso, quanto maior a quantidades de dados da categoria (ou classe), mais alto será a barra (ou retângulo) (Morettin and O. Bussab 2017).

O boxplot apresenta o valor mínimo, primeiro, segundo e terceiro quartil, mediana e o valor máximo de uma determinada variável. Ou seja, é a representação de medidas de posição da variável, as quais serão apresentadas a seguir. O primeiro quartil apresenta 25% dos dados; o segundo, 50%, o que também é a mediana porque os dados estejam ordenados; e o terceiro, 75%. Com o gráfico, é possível verificar se existem dados discrepantes localizados fora dos limites superior e inferior.

References

Bruce, Peter, and Andrew Bruce. 2019. Estatística Prática Para Cientistas de Dados - 50 Conceitos Essenciais. Edited by Alta Books. Starlin Alta Editora e Consultoria Eireli.
Favero, Luiz P. 2017. Manual de Análise de Dados - Estatística e Modelagem Multivariada Com Excel®, SPSS® e Stata®. Grupo GEN. https://integrada.minhabiblioteca.com.br/#/books/9788595155602/.
Morettin, Pedro A, and Wilton de O. Bussab. 2017. Estatística Básica. Editora Saraiva. https://integrada.minhabiblioteca.com.br/#/books/9788547220228/.