====== Estrutura Espacial ======
Nesse tutorial vamos tratar do reconhecimento de um dos padrões mais básicos de uma população de plantas: se os indivíduos estão espacialmente mais próximos ou mais afastados do que seria esperado se simplesmente fossem distribuídos ao acaso ((ou seja, a localização de um indivíduo não melhora a predição de onde outros indivíduos podem estar)).
===== Objetivo =====
{{ :ecovirt:roteiro:26_fha_rshow_terra3.jpg?300|}}
Investigar o padrão espacial em populações de plantas e discutir quais processos subjacentes poderiam gerar os padrões observados. Antes de tudo, porém, precisamos definir alguns conceitos.
===== Contexto =====
Um padrão espacial é uma estrutura previsível que pode ser detectada e quantificada. Em geral, considera-se que um padrão é uma estrutura diferente do aleatório, entretanto, no caso dos padrões espaciais (e outros também) o padrão aleatório também pode ser considerado um padrão, afinal tem {{:ecovirt:roteiro:26_fha_rshow_terra5.jpg?300 |}}alguma previsibilidade ((por exemplo, em relação ao número médio de indivíduos)) e pode ser detectado e quantificado. Existem diversas métricas utilizadas para descrever a distribuição de indivíduos que são capazes de diferenciar, com maior ou menor eficiência, os três padrões espaciais básicos: aleatório, homogêneo e agregado.
//**__Padrões Espaciais__**//
* ''aleatório'': a distribuição dos indivíduos não é diferente do que seria esperado por uma distribuição ao acaso;
* ''regular'' ou ''homogêneo'': os indivíduos estão regularmente espaçados. É chamado também de padrão disperso, pois está relacionado ao maior distanciamento possível entre indivíduos;
* ''agregado'': os indivíduos estão mais próximos do que esperado por um padrão aleatório, formando agrupamentos.
Detectar um padrão espacial pode ser importante tanto para entender os mecanismos que geram o padrão, como para decidir o método e a escala de amostragem e planejar o manejo de uma população. Algumas propriedades desejáveis de uma medida do padrão espacial são:
* diferenciar claramente o padrão;
* não ser afetada por: tamanho da amostra, densidade populacional ou pela variação no tamanho e na forma da amostra;
* ser estatisticamente tratável: passível de calcular a incerteza do valor e testar a diferenças entre amostras.
Para essa prática usaremos uma estimativa de aleatoriedade de pontos chamada K-Ripley (e sua padronização chamada L-Ripley). Primeiro iremos utilizar dados de distribuição simulados com diferentes padrões e em seguida utilizar a mesma técnica para detectar o padrão espacial em uma população natural.
//**__Roteiro__**//
/* [[ep1| Parte 1]]: simulando amostras dentro da parcela;
* [[2019:roteiros:ep2|Padrão Multiescala]]
*/
===== Padrões multiescala =====
{{ :ecovirt:roteiro:pattern.jpg |}}
/*
O roteiro de [[ep1|índice de dispersão]]((podem rodá-lo em outro momento!)) demonstra como o padrão de distribuição pode ser afetado pelo tamanho da parcela usada. Isso significa que o padrão espacial pode ser **dependente de escala**.
*/
Nesta prática vamos quantificar o padrão espacial usando um método multiescala. Os métodos de multiescala permitem, com uma única métrica, avaliar como o padrão espacial varia com a escala. Iremos descrever o padrão espacial para o conjunto total de indivíduos em uma população em uma área delimitada e iremos avaliar o padrão desde a escala da vizinhança dos indivíduos até a escala mais ampla da população.
{{ :ecovirt:roteiro:mandelbrot-fractals-o.gif?|}}
Para a prática vamos utilizar um programinha chamado [[https://www.ufz.de/index.php?en=41413|Programita]], feito pelo pesquisador Thorsten Wiegand para quantificar o padrões espaciais usando medidas multiescala baseadas em distância entre pontos. Para baixar o manual do **Programita** clique
{{:ecovirt:roteiro:manualprogramita2004b.pdf|aqui}}.
No **Programita** existem várias medidas que podem ser usadas para calcular o padrão espacial, vamos usar duas delas: o **K de Ripley (na verdade, vamos usar sua padronização L-Ripley)** e o **O-ring**.
Ambas são abordagens baseadas em pontos, que utilizam o cálculo de distâncias ponto a ponto dentro de uma área delimitada. Essas medidas podem ser usadas para análises univariadas, ou seja, identificando o padrão para uma única classe de pontos, ou para análises bivariadas, que identifica o padrão entre dois tipos de pontos. As análises bivariadas podem ser usadas no contexto de populações para verificar se indivíduos de um dado estágio estão espacialmente associados a outro, ou no contexto de estruturação de comunidades para analisar se há atração ou repulsão na ocorrência de uma espécie em relação a outra.
==== K de Ripley ====
{{:ecovirt:roteiro:ripleys_game.jpg?100 |}}
O K de Ripley é uma medida da densidade média ao redor de cada ponto. Para cada ponto na área de estudo é calculada a densidade no interior de um círculo de raio r centrado no ponto (área cinza da figura). Em seguida, calcula-se uma média desses valores obtidos para todos os pontos.
{{ :ecovirt:roteiro:lripley.jpg?200 |}}
Figura: Implementação da estatística L de Ripley: contagem do número de pontos distantes de ''i'' no interior do círculo de raio ''r''. Extraído de Wiegand & Moloney (2004).
A operação é repetida para diferentes valores de ''r'', que permite avaliar de maneira contínua o valor de ''K'' para diferentes escalas.
$$ K_{(r)} = \frac{\sum_{i\neq{j}}^{i}I({d_{ij} 0''** e para **uma distribuição homogênea ''L < 0''**.
==== O-ring (O(r)) ====
{{:ecovirt:roteiro:onion_ring.jpg?200 |Onion ring to rule them all}}
A estatística **O-ring** é similar ao L de Ripley, mas baseada em um **anel**, ao invés de um círculo. É medida pela contagem do número de pontos em um anel de raio //r// e largura fixa. Da mesma forma que o L-Ripley,também são calculadas as intensidades para diferentes tamanhos de anel, mantendo a largura fixa.
{{ :ecovirt:roteiro:o-ring.jpeg?200 |}}
Figura: Implementação da estatística //O-ring//: contagem do número de pontos distantes de //i// ao longo do raio //r//. Extraído de Wiegand & Moloney (2004).
Logo, definimos $O(r)$ como:
$$ O_{(r)} = L_{(r)} - L_{(r-l)}$$
Onde:
* $r -l$ : é o raio menos a largura do anel ((igual ao raio interno do anel))
Na completa aleatoriedade espacial (CAE) $O(r) = \lambda$ (intensidade do padrão), quando o padrão é agregado $O(r) > \lambda$ e quando o padrão é homogêneo $O(r) < \lambda$.
As medidas $K_{(r)}$, $L_{(r)}$ ou $O_{(r)}$ apresentam soluções analíticas teóricas para o padrão definido como processo Poisson ou Completa Aleatoriedade Espacial (CAE). Ou seja, quando a distribuições dos pontos no espaço estudado não é diferente do esperado pelo acaso. Para uma dada densidade de pontos conseguimos calcular esses valores teóricos para qualquer raio. Dessa forma, para interpretar o padrão espacial dos pontos observados precisamos:
* calcular os valores observados e o teóricos para CAE;
* comparar esses valores;
* definir quando uma diferença é ou não aceitável para afirmar que o padrão é diferente do aleatório;
Para os dois primeiros tópicos acima, usamos as fórmulas e calculamos os valores. Para tirar a subjetividade do terceiro, podemos calcular intervalos de confiança ou gerar envelopes((equivalente a intervalo de confiança obtido por simulação numérica )) de confiança por simulações computacionais, para definir objetivamente o que é algo diferente do esperado para a CAE.
===== Padrões de Pontos Simulados =====
**//__Atividade 1:__//**
{{ :ecovirt:roteiro:escala.jpg?300 |}}
Qual processo gerou o padrão de pontos?
==== Instruções gerais ====
* 1. baixe os arquivos relacionados ao padrão espacial 01 **OU** 02 (você escolhe) __na mesma pasta em que o Programita esteja instalado__. Caso abra uma página mostrando os dados, clique no link com o botão direito do mouse para salvar o arquivo. Salve no formato ".dat":
//**__ Dados para Análise Espacial__**//
=== Padrão 1 ===
* {{:ecovirt:roteiro:padrao01all.dat|População (todos os indivíduos, sem distinguir adultos e jovens)}}
* {{:ecovirt:roteiro:padrao01par.dat|Parentais (somente os adultos)}}
* {{:ecovirt:roteiro:padrao01prole.dat|Prole (somente os jovens)}}
* {{:ecovirt:roteiro:padrao01bi.dat|Bivariado (todos os indivíduos, distinguindo adultos e jovens)}}
=== Padrão 2 ===
* {{:ecovirt:roteiro:padrao02all.dat|População (todos os indivíduos, sem distinguir adultos e jovens)}}
* {{:ecovirt:roteiro:padrao02par.dat|Parentais (somente os adultos)}}
* {{:ecovirt:roteiro:padrao02prole.dat|Prole (somente os jovens)}}
* {{:ecovirt:roteiro:padrao02bi.dat|Bivariado (todos os indivíduos, distinguindo adultos e jovens)}}
* caso não tenha o ''programita'' instalado, baixe o {{:ecovirt:roteiro:programita.zip|programita aqui}} na mesma pasta do arquivo de dados;
* descompacte o arquivo //programita.zip//;
* clique 2x para abrir o arquivo executável ''ProgramitaJulio2006.exe''.
Bem vindo(a) ao **Programita**! Agora vamos abrir os dados que iremos trabalhar.
O **Programita** aceita arquivos de texto das extensões .dat e .asc. São arquivos em formato de texto, separados por tabulação (ou espaço). Os arquivos de dados possuem a seguinte estrutura:
** A primeira linha contém informações gerais sobre o arquivo de dados:**
* valor mínimo da coordenada x;
* valor máximo da coordenada x;
* valor mínimo da coordenada y;
* valor máximo da coordenada y; e
* número total de indivíduos
** A partir da segunda linha, estão os dados dos pontos que serão analisados:**
* primeira coluna com as coordenadas x dos indivíduos;
* segunda coluna com as coordenadas y dos indivíduos;
* no caso de dados univariados, a terceira coluna será sempre 1 e a quarta coluna sempre 0.
* no caso de dados bivariados a terceira coluna tem os pontos dos indivíduos tipo A (adultos, por exemplo) identificados por 1 e do tipo B (jovens, por exemplo) identificados por 0 ;
* ainda no caso de dados bivariados, a quarta coluna tem os pontos dos indivíduos do tipo A identificados por 0 e do tipo B identificados por 1 .
{{ :ecovirt:roteiro:ex_dados.png |}}
Fig. Exemplo de arquivo .dat no formato de uso no //Programita//.
==== Padrão Univariado: todos os pontos ====
* 1. Verifique se na janela //Input data file// estão aparecendo os arquivos .dat. Caso não esteja, **verifique se o arquivo executável do programita está na mesma pasta dos arquivos //.dat//**.
Dependendo da configuração do seu navegador o arquivo salvo pode aparecer com uma extensão diferente (p.ex. ".bin"). Nesse caso é preciso mudar a extensão do arquivo para ".dat".
* 2. no menu à esquerda selecione o arquivo ** padrao"0X"all.dat**. No caso **X** vai ser 1 ou 2 dependendo da sua escolha;
{{ :ecovirt:roteiro:arquivos.png?300 |}}
Figura. Janela de entrada de dados do //Programita//.
* 3. Em //**How your data are organized**// selecione //**List**//
* 4. Vamos começar usando o L de Ripley então em //**Which method to use**// selecione //**Circle ou Ripley** (a depender da versão que foi baixada)//
* 5. Em //**Select modus of data**// selecione //**List with coordinates no grid**//. Ao selecionar esta opção aparecerá uma janela com a opção //**Select a new cell size**//:
{{ :ecovirt:roteiro:cell_size.png?300 |}}.
* 6. Caso tenha menos de 500 pontos, altere o //**proposed cell size**// para 1. Caso contrário deixe no padrão do programa.
* 7. Feito tudo isso, você deve estar assim:
{{ :ecovirt:roteiro:programita.jpg?300 |}}
* 8. Você pode agora respirar fundo e apertar o botão //**Calculate index**//;
A saída visual do programa é um mapa onde os indivíduos aparecem em pontos vermelhos, seguindo as coordenadas do arquivo de dados. O gráfico no canto superior direito corresponde ao valor do L-Ripley para diferentes raios. Nessa saída gráfica é possível analisar como o padrão espacial varia de acordo com a escala. Para dados univariados, ignore o gráfico inferior.
Porém, olharmos apenas o formato da curva não é suficiente para afirmamos em que escalas a população é agregada. Para isso precisamos comparar o resultado observado com o padrão que seria gerado pela distribuição dos pontos completamente aleatório. Esse modelo nulo é chamado de **//completa aleatoriedade espacial//**. Para gerar esse modelo por simulação é necessário recolocar o mesmo número de pontos de forma aleatória na mesma área. Se fizermos isso, muitas e muitas vezes, é possível gerar um envelope de confiança (similar ao intervalo de confiança) no qual o padrão de distribuição aleatória é encontrado. Se os valores observados estão contidos dentro do envelope podemos concluir que nosso padrão não é diferente do aleatório.
Para fazer isso você deve:
* 9. selecionar a opção **//Calculate confidence limits//** e;
* 10. na janela **//Select a null model//** selecionar o modelo nulo //**Pattern 1 and 2 random**//;
* 11. verifique se sua tela está como a figura e clique novamente no botão //**Calculate index**//.
{{ :ecovirt:roteiro:null_model.png |}}
Caso a simulação esteja demorando muito
* aperte o botão de //stop// ao lado do //Calculate index//;
* selecione outro //"modus of data"// e em seguida selecione novamente //list with coordenate,...//;
* na janela //Select a new cell size//, altere //proposed cell size // para 2;
* na janela // Select a null model// altere //# simulations// para 20;
* aperte novamente o botão //Calculate index//;
//**__Descreva o padrão observado__**//
O //Programita// permite acompanhar graficamente a simulação ao longo do tempo ;-). É possível observar que a cada simulação é gerada uma distribuição aleatória dos indivíduos e recalculado os valores de L-Ripley. Ao final é gerado o gráfico com os valores observados a partir do arquivo de dados, acompanhado do envelope de confiança gerado a partir da simulação de completa aleatoriedade espacial. Valores fora do intervalo de confiança indicam a existência de um padrão espacial diferente do aleatório.
**//__Dica:__//**
Faça um **__//Print Screen//__** dos seus resultados para salvar o gráfico de cada análise que fizer ao longo da prática.
* 12. Faça o mesmo procedimento, porém em **//Which method to use//** selecione **//Ring//**
* 13. Compare os resultados entre o L-Ripley e o O-Ring.
**//__Atividade__//**
* repita a análise com L-Ripley e O-Ring para os arquivos com:
* os pontos dos adultos (parentais): //padrao"0X"par.dat// e;
* os pontos dos jovens (prole): //padrao"0X"prole.dat//;
* interprete o resultado para cada tipo de ponto;
==== Padrão Bivariado: dois tipos de pontos ====
O //Programita// permite a análise de padrão de pontos de uma classe em relação a outra (por exemplo juvenis em relação a adultos). Para isso é necessário diferenciar os pontos no arquivo de dados, utilizando 0 ou 1 nas colunas 3 e 4, como mostra a figura abaixo, em um arquivo que distinguia indivíduos adultos de juvenis:
{{ :ecovirt:roteiro:ex_dados2.png?700 |}}
Vamos agora analisar o padrão dos pontos associados (PROLE) em relação aos parentais (PAR), seguindo o mesmo procedimento anterior.
* 1. selecione o arquivo com a separação de classes de pontos parentais e associados: //padrao"0X"bi.dat//;
* 2. em //**What do you want to do**// selecione a opção //**Point-pattern analysis**//
* 3. em //**How your data are organized**// selecione //**List**//
* 4. neste caso, estamos interessados na análise do padrão em escala cumulativa para entender até que distância há agregação, por isso, em //Which method to use// selecione **Circle** ou **Ripley** (a depender da versão que estiver usando)
* 5. em //**Select modus of data**// selecione //**List with coordinates no grid**//
* 6. para testarmos se existe agregação dos pontos PROLE em relação ao PAR , utilizaremos o envelope de confiança. Selecione a opção //**Calculate confidence limits**// e selecione o modelo nulo //**Pattern 1 fix, 2 random**//.
* 7. rode a análise apertando: //**Calculate index**//
* 8. interprete os resultados. **Obs.: o gráfico que mostra o padrão de associação é o inferior, denominado "Bivariate L-function(Ripley)". O gráfico superior é o mesmo que o gráfico do padrão tipo A univariado (no nosso caso, o padrão dos adultos), com pequenas diferenças nos limites do eixo Y.**
//**__Descubra o algoritmo__**//
Algoritmo é uma sequência de passos para executar uma tarefa. Os pontos dos arquivos de dados foram gerados por um algoritmo muito simples em duas fases: primeiro foram gerados os pontos parentais e em seguida os pontos associados (prole). Descreva uma sequencia de tarefas ((p.ex: gerar 10 valores de x a partir de uma distribuição aleatória uniforme de 0 a 100; gerar valores de uma sequência de 10 a 90 a cada intervalo de 5 como o y.... )) que seria capaz de gerar a distribuição de pontos (incluindo ambas classes de pontos) que você observou a partir do seu arquivo de dados.
------
------
===== Distribuição Espacial de Palmitos na Restinga =====
{{:ecovirt:roteiro:palmito00.jpg?300 |}}
O Palmiteiro (//Euterpe edulis// Mart.) é uma espécie muito característica das florestas atlânticas e costuma ocorrer com densidades altas em áreas mais preservadas. Vamos agora analisar os dados referentes a uma população de palmitos que ocorre em uma parcela de floresta de Restinga na Ilha do Cardoso, Cananéia -SP. Os dados foram coletados nos anos de 2009/2010 em uma área de 10,24ha (320m x 320m).
Preparamos três arquivos no formato lido pelo //Programita//:
- dados de indivíduos juvenis (diâmetro do tronco entre 1 e 5 cm): {{ :ecovirt:roteiro:juvenil.dat |}}
- dados de indivíduos adultos (diâmetro do tronco > 5 cm): {{ :ecovirt:roteiro:adulto.dat |}}
- juvenis e adultos (padrão 1 adulto, padrão 2 juvenil): {{:ecovirt:roteiro:juvenil_adulto.dat|}}
\\
\\
Utilize as ferramentas disponíveis no //Programita// para descrever os padrões espaciais:
* da população total de palmito;
* apenas dos juvenis e;
* apenas dos adultos.
Investigue se a distribuição dos juvenis está associada a dos adultos.
//**__Padrões & Processos__**//
Junte-se em um grupo de 2 a 4 alunos e discuta quais possíveis processos poderiam gerar os padrões descritos.