This translation is older than the original page and might be outdated. See what has changed.

User Tools

Site Tools


en:ecovirt:roteiro:pad_spat

This is an old revision of the document!


Spacial Pattern

In this tutorial we are going to deal with recognizing one of the most basic patterns of a plant population: whether individuals are spatially closer or further apart than would be expected if they were simply randomly distributed (i.e., the location of an individual does not improve the prediction of where other individuals may be)).

Target

26_fha_rshow_terra3.jpg Investigate the spatial pattern in plant populations and discuss what underlying processes could generate the observed patterns. First of all, however, we need to define some concepts.

Context

A spatial pattern is a predictable structure that can be detected and quantified. In general, a pattern is considered to be a different structure than a random one, however, in the case of spatial patterns (and others as well) the random pattern can also be considered a pattern, after all it has 26_fha_rshow_terra5.jpgsome predictability (eg in relation to the average number of individuals)) and can be detected and quantified. There are several metrics used to describe the distribution of individuals that are able to differentiate, with greater or lesser efficiency, the three basic spatial patterns: random, homogeneous and aggregated.

Spatial Patterns

  • random: the distribution of individuals is not different from what would be expected by a random distribution;
  • regular or homogeneous: individuals are regularly spaced. It is also called dispersed pattern, as it is related to the greatest possible distance between individuals;
  • aggregate: individuals are closer than expected by a random pattern, forming clusters.

Detecting a spatial pattern can be important both for understanding the mechanisms that generate the pattern, for deciding on the sampling method and scale, and for planning the management of a population. Some desirable properties of a spatial pattern measure are:

  • clearly differentiate the pattern;
  • not be affected by: sample size, population density, or variation in sample size and shape;
  • be statistically tractable: able to calculate the uncertainty of the value and test for differences between samples.

For this practice we will use a point randomness estimate called K-Ripley. First we will use simulated distribution data with different patterns and then use the same technique to detect the spatial pattern in a natural population.

Roteiro

Multiscale Patterns

pattern.jpg

In this practice we will quantify the spatial pattern using a multiscale method. Multiscale methods allow, with a single metric, to assess how the spatial pattern varies with scale. We will describe the spatial pattern for the total set of individuals in a population in a delimited area and we will assess the pattern from the scale of the neighborhood of individuals to the wider scale of the population.

mandelbrot-fractals-o.gif

For practice we will use a little program called Programita, made by researcher Thorsten Wiegand to quantify spatial patterns using multiscale measures based on distance between points. To download the Programita manual click

here.

In Programita there are several measurements that can be used to calculate the spatial pattern, we will use two of them: Ripley's L and O-ring.

Both are point-based approaches, which use the calculation of point-to-point distances within a bounded area. These measures can be used for univariate analyses, that is, identifying the pattern for a single class of points, or for bivariate analyses, which identifies the pattern between two types of points. Bivariate analyzes can be used in the context of populations to verify whether individuals of a given stage are spatially associated with another, or in the context of community structuring to analyze whether there is attraction or repulsion in the occurrence of one species in relation to another.

Ripley's K

ripleys_game.jpg

Ripley's K is a measure of the average density around each point. For each point in the study area, the density inside a circle of radius r centered on the point (gray area of ​​the figure) is calculated. Then, an average of these values ​​obtained for all points is calculated.

lripley.jpg Figure: Implementation of Ripley's L statistic: counting the number of points far from i inside the circle of radius r. Taken from Wiegand & Moloney (2004).

The operation is repeated for different r values, which allows continuous evaluation of the K value for different scales.

$$ K_{(r)} = \frac{\sum_{i\neq{j}}^{i}I({d_{ij}<r})}{n}\frac{1}{\lambda} $$

Where:

  • $d_{ij}$ is the distance from point $i$ to point $j$;
  • $I({d_{ij}<r})$ indicator function, being 1 if the point $j$ is at a distance less than $r$ from the point $i$ and 0 if the point $j$ is outside this radius $r$ around $i$;
  • $n$ is the total number of points;
  • $\lambda$ is the density of the points.

The visual interpretation of K is not very intuitive as it is a cumulative function associated with the area of ​​the circle relative to r. Ripley's L, in turn, is the standardization of this value:

$$ L_{(r)}= (\sqrt{\frac{K_{(r)}}{\pi}}-r) $$

This transformation makes the value of L for a completely random distribution always be 0 and L > 0 indicates aggregation, while L < 0 indicates homogeneous pattern.

O-ring (O(r))

Onion ring to rule them all

A estatística O-ring é similar ao L de Ripley, mas baseada em um anel, ao invés de um círculo. É medida pela contagem do número de pontos em um anel de raio r e largura fixa. Da mesma forma que o L-Ripley também são calculadas as intensidades para diferentes tamanhos de anel, mantendo a largura fixa.

o-ring.jpeg Figura: Implementação da estatística O-ring: contagem do número de pontos distantes de i ao longo do raio r. Extraído de Wiegand & Moloney (2004).

Logo, definimos $O(r)$ como: $$ O_{(r)} = L_{(r)} - L_{(r-l)}$$

Onde:

  • $r -l$ : é o raio menos a largura do anel 1)

Na completa aleatoriedade espacial $O(r) = \lambda$ (intensidade do padrão), quando o padrão é agregado $O(r) > \lambda$ e quando é homogêneo $O(r) < \lambda$

As medidas $K_{(r)}$, $L_{(r)}$ ou $O_{(r)}$ apresentam soluções analíticas teóricas para o padrão definido como processo Poisson ou Completa Aleatoriedade Espacial (CAE). Ou seja, quando a distribuições dos pontos no espaço estudado não é diferente do esperado pelo acaso. Para uma dada densidade de pontos conseguimos calcular esses valores teóricos para qualquer raio. Dessa forma, para interpretar o padrão espacial dos pontos observados precisamos:

  • calcular os valores observados e o teóricos para CAE;
  • comparar esses valores;
  • definir quando uma diferença é ou não aceitável para afirmar que o padrão é diferente do aleatório;

Para os dois primeiros tópicos acima, usamos as fórmulas e calculamos os valores. Para tirar a subjetividade do terceiro, podemos calcular intervalos de confiança ou gerar envelopes2) de confiança por simulações computacionais, para definir objetivamente o que é algo diferente do esperado para a CAE.

Padrões de Pontos Simulados

Atividade 1:

escala.jpg Qual processo gerou o padrão de pontos?

Instruções gerais

  • 1. baixe os arquivos relacionados ao padrão espacial 1 ou 2. Caso abra uma página mostrando os dados, clique no link com o botão direito do mouse para salvar o arquivo no seu computador:
  • caso não tenha o programita instalado, baixe o programita aqui na mesma pasta do arquivo de dados;
  • descompacte o arquivo programita.zip;
  • clique 2x para abrir o arquivo executável ProgramitaJulio2006.exe.

Bem vindo(a) ao Programita! Agora vamos abrir os dados que iremos trabalhar.

O Programita aceita arquivos de texto das extensões .dat e .asc. São arquivos em formato de texto, separados por tabulação (ou espaço). Os arquivo de dados possui a seguinte estrutura:

A primeira linha contém informações gerais sobre o arquivo de dados:

  • valor mínimo de x;
  • valor máximo de x;
  • valor mínimo de y;
  • valor máximo de y; e
  • número total de indivíduos

A partir da segunda linha, estão os dados dos pontos que serão analisados:

  • primeira coluna com as coordenadas x dos indivíduos;
  • segunda coluna com as coordenadas y dos indivíduos;
  • terceira coluna com os pontos do padrão 1 identificados por 1 e do padrão 2 por 0 3);
  • quarta coluna com os pontos do padrão 1 identificado por 0 e do padrão 2 por 1 4).

No caso de dados univariados, a terceira coluna será sempre 1 e a quarta coluna sempre 0. Para dados bivariados as terceira e quarta colunas terão valores de 0 e 1 de acordo com o padrão do ponto.

ex_dados.png Fig. Exemplo de arquivo .dat no formato de uso no Programita.

Padrão Univariado: todos os pontos

  • 1. Verifique se na janela Input data file estão aparecendo os arquivos .dat. Caso não esteja, verifique se o arquivo executável do programita está na mesma pasta dos arquivos .dat.

Dependendo da configuração do seu navegador o arquivo salvo pode aparecer com uma extensão diferente (p.ex. “.bin”). Nesse caso é preciso mudar a extensão do arquivo para “.dat”.

  • 2. no menu à esquerda selecione o arquivo padrao“0X”all.dat. No caso X vai ser 1 ou 2 dependendo da sua escolha;

arquivos.png Figura. Janela de entrada de dados do Programita.

  • 3. Em How your data are organized selecione List
  • 4. Vamos começar usando o L de Ripley então em Which method to use selecione Circle
  • 5. Em Select modus of data selecione List with coordinates no grid. Ao selecionar esta opção aparecerá uma janela com a opção Select a new cell size:

cell_size.png.

  • 6. Caso tenha menos de 500 pontos, altere o proposed cell size para 1. Caso contrário deixe no padrão do programa.
  • 7. Feito tudo isso, você deve estar assim:

programita.jpg

  • 8. Você pode agora respirar fundo e apertar o botão Calculate index;

A saída visual do programa é um mapa onde os indivíduos aparecem em pontos vermelhos, seguindo as coordenadas do arquivo de dados. O gráfico no canto superior direito corresponde ao valor do L-Ripley para diferentes raios. Nessa saída gráfica é possível analisar como o padrão espacial varia de acordo com a escala.

Porém, isso não é suficiente para afirmamos em que escalas a população é agregada. Para isso precisamos comparar o resultado observado com o padrão que seria gerado pela distribuição dos pontos completamente aleatório. Esse modelo nulo é chamado de completa aleatoriedade espacial. Para gerar esse modelo por simulação é necessário recolocar o mesmo número de pontos de forma aleatória na mesma área. Se fizermos isso, muitas e muitas vezes, é possível gerar um envelope de confiança (similar ao intervalo de confiança) no qual o padrão de distribuição aleatória é encontrado. Se os valores observados estão contidos dentro do envelope podemos concluir que nosso padrão não é diferente do aleatório.

Para fazer isso você deve:

  • 9. selecionar a opção Calculate confidence limits e;
  • 10. na janela Select a null model selecionar o modelo nulo Pattern 1 and 2 random;
  • 11. verifique se sua tela está como a figura e clique novamente no botão Calculate index.

null_model.png

Caso a simulação esteja demorando muito

  • aperte o botão de stop ao lado do Calculate index;
  • selecione outro “modus of data” e em seguida selecione novamente list with coordenate,…;
  • na janela Select a new cell size, altere proposed cell size para 2;
  • na janela Select a null model altere # simulations para 20;
  • aperte novamente o botão Calculate index;

Descreva o padrão observado

O Programita permite acompanhar graficamente a simulação ao longo do tempo ;-). É possível observar que a cada simulação é gerada uma distribuição aleatória dos indivíduos e recalculado os valores de L-Ripley. Ao final é gerado o gráfico com os valores observados a partir do arquivo de dados, acompanhado do envelope de confiança gerado a partir da simulação de completa aleatoriedade espacial. Valores fora do intervalo de confiança indicam a existência de um padrão espacial diferente do aleatório.

Dica: Faça um Print Screen dos seus resultados para salvar o gráfico de cada análise que fizer ao longo da prática.

  • 12. Faça o mesmo procedimento, porém em Which method to use selecione Ring
  • 13. Compare os resultados entre o L-Ripley e o O-Ring.

Atividade

  • repita a análise para os arquivos com:
    • os pontos dos parentais (adultos): padrao“0X”par.dat e;
    • os pontos dos pontos associados - prole (jovens): padrao“0X”prole.dat;
  • interprete o resultado para cada tipo de ponto;

Padrão Bivariado: duas classes de pontos

O Programita permite a análise de padrão de pontos de uma classe em relação a outra. Para isso é necessário diferenciar os pontos no arquivo de dados, utilizando 0 ou 1 nas colunas 3 e 4, como mostra a figura abaixo, em um arquivo que distinguia indivíduos adultos de juvenis:

ex_dados2.png

Vamos agora analisar o padrão dos pontos associados (PROLE) em relação aos parentais (PAR), seguindo o mesmo procedimento anterior.

  • 1. selecione o arquivo com a separação de classes de pontos parentais e associados: padrao“0X”bi.dat;
  • 2. em What do you want to do selecione a opção Point-pattern analysis
  • 3. em How your data are organized selecione List
  • 4. neste caso, estamos interessados na análise do padrão em escala cumulativa para entender até que distância há agregação, por isso, em Which method to use selecione L-Ripley
  • 5. em Select modus of data selecione List with coordinates no grid
  • 6. para testarmos se existe agregação dos pontos PROLE em relação ao PAR , utilizaremos o envelope de confiança. selecione a opção Calculate confidence limits e selecione o modelo nulo Pattern 1 fix, 2 random.
  • 7. rode a análise apertando: Calculate index
  • 8. interprete os resultados.

Descubra o algoritmo

Algoritmo é uma sequência de passos para executar uma tarefa. Os pontos dos arquivos de dados foram gerados por um algoritmo muito simples em duas fases: primeiro foram gerados os pontos parentais e em seguida os pontos associados (prole). Descreva uma sequencia de tarefas 5) que seria capaz de gerar a distribuição de pontos (incluindo ambas classes de pontos) que você observou a partir do seu arquivo de dados.



Distribuição Espacial de Palmitos na Restinga

palmito00.jpg O Palmiteiro (Euterpe edulis Mart.) é uma espécie muito característica das florestas atlânticas e costuma ocorrer com densidades altas em áreas mais preservadas. Vamos agora analisar os dados referentes a uma população de palmitos que ocorre em uma parcela de floresta de Restinga na Ilha do Cardoso, Cananéia -SP. Os dados foram coletados nos anos de 2009/2010 em uma área de 10,24ha (320m x 320m).

Preparamos três arquivos no formato lido pelo Programita:

  1. dados de indivíduos juvenis (diâmetro do tronco entre 1 e 5 cm): juvenil.dat
  2. dados de indivíduos adultos (diâmetro do tronco > 5 cm): adulto.dat
  3. juvenis e adultos (padrão 1 adulto, padrão 2 juvenil): juvenil_adulto.dat



Utilizando as ferramentas disponíveis no Programita para descrever os padrões espaciais:

  • da população total de palmito;
  • apenas dos juvenis e;
  • apenas dos adultos.

Investigue se a distribuição dos juvenis está associada a dos adultos.

Padrões & Processos Junte-se em um grupo de 2 a 4 alunos e discuta quais possíveis processos poderiam gerar os padrões descritos.

1)
igual ao raio interno do anel
2)
equivalente a intervalo de confiança obtido por simulação numérica
3)
no caso de dados bivariados
4)
tb. no caso de dados com dois tipos de pontos
5)
p.ex: gerar 10 valores de x a partir de uma distribuição aleatória uniforme de 0 a 100; gerar valores de uma sequência de 10 a 90 a cada intervalo de 5 como o y….
en/ecovirt/roteiro/pad_spat.1663257131.txt.gz · Last modified: 2022/09/15 12:52 by adalardo