Para a aplicação será reproduzido o exemplo do TBEP R Training. Para isso, serão instalados os pacotes sf
e mapview
options(repos = list(CRAN="http://cran.rstudio.com/"))
O shapefile “sgdat.shp” são dados da cobertura de algas marinhas em Tampa Bay em 2016. As “features” são as linhas do vetor e os “fields” são as colunas, ou melhor, atributos (“OBJECT ID” e “FLUCCS”). O SGR do arquivo é WGS 84. A coluna “geometry” armazena os dados espaciais (longitude e latitude).
Esse é o passo a passo de como importar um shapefile. Porém, muitas vezes não possuímos um shapefile e queremos criar um a partir de um dataframe. Para isso, é necessário que o dataframe inclua as coordenadas geográficas (longitude e latitude) e que tenhamos conhecimento do SGR. O dataframe ´fishdat´ possui as características dos peixes encontrados e o statloc apresenta a localização deles. O passo a passo será realizado abaixo.
# dados da presença de peixes em Tampa Bay
<- read.csv("Data/fishdat.csv")
#localização geográfica dos peixes
<- read.csv("Data/statloc.csv") statloc
# estrutura dos dados
Para isso, utilizaremos a função st_as_sf()
para transformar o dataframe em um objeto sf. Primeiramente, precisamos juntar os dois datasets (fishdat e statloc) e dizer qual coluna que possui os dados da geometria (latitude e longitude). Além disso, é necessário dizer qual o SGR e, além disso, precisamos garantir que ambos datasets possuam o mesmo SGR. Por enquanto, podemos fazer um “chute calibrado” que é o WGS84.
#juntando os dois dataframes
<- left_join(fishdat,statloc,by="Reference")
#criando o objeto de dados espaciais
<- st_as_sf(joindata, coords=c('Longitude','Latitude'), crs = st_crs(sgdat))
#tipo de objeto sf
#checando SGR
Caso seja necessário modificar a projeção, utiliza-se a função `st_transform()
. Nesse caso, não precisamos modificar já que o shapefile (sgdat) tem o mesmo SGR do que estamo querendo criar.
Agora, iniciaremos a análise geoespacial dos dados. Inicialmente, iremos dar uma olhada geral para entender qual os dados que estamos lidando.
O padrão é que a função ´plot()´ plote todas as feições. Para plotar somente a geometria, utiliza-se st_geometry()
Conforme observamos o shapefile “sgdat” com os dados das algas marinhas e o “joindata” com os dados do posicionamento de peixes, é possível verificar que existem áreas de intersecção entre ambos. Para analisar novamente, iremos plotar somente a geometria de ambos:
Vamos filtrar somente os dados dos peixes do ano de 2016:
<- joindata %>%
filt_data filter(yr == 2016)
Agora, verificaremos quantos peixes foram vistos nos mesmos locais em que encontraram-se algas marinhas em 2016. Ou seja, iremos selecionar as localizações que possuem ambos dados. Para isso, iremos utilizar o código abaixo:
<- filt_data[sgdat, ]
O que foi realizado até agora é somente a intersecção da geometria de ambos datasets. Portanto, agora realizaremos a intersecção de ambos dados, incluindo atributos:
<- st_intersection(filt_data, sgdat)
É possível utilizar ferramentas do tidyverse
. Abaixo, iremos fazer a soma de todos os Pinfish foram pegos em 2016:
<- fish_int %>%
fish_cnt group_by(FLUCCS) %>%
cnt = sum(Pinfish)
Além de realizar a soma nos atributos numéricos (quantidade de Pinfish), também é realizada nos atributos geométricos (latitude e longitude). Conforme apresentado na tabela anterior, existe uma maior quantidade de Pinfishs em áreas onde existe maior quantidade de algas marinhas (FLUCCS=9116). É possível realizar um gráfico em relação às duas categorias de cobertura de algas marinhas (´9113´: desigual, ´9116´: contínua).
ggplot(fish_cnt, aes(x = FLUCCS, y = cnt)) +
geom_bar(stat = 'identity', fill='navyblue')
Agora será realizada a confecção de mapas. Utilizaremos os pacotes ggplot2
ggplot() +
geom_sf(data = sgdat, fill = 'green') +
geom_sf(data = joindata)
Agora, para criar um mapa interativo para selecionar e dar zoom nos dados, utilizaremos o pacote mapview
mapview(sgdat, col.regions = 'green') +
mapview(joindata, zcol = 'Gear')