1 Contextualização (Ainda em construção!)

  • No tutorial Simulação de Dados Dendrométricos foram simulados dados (assumindo distribuição normal) para as variáveis diâmetro a 1,30m do solo (\(d\)) e altura (\(h\)) para uma população florestal hipotética de 🌳Khaya Ivorensis🌳 (10 hectares). Em seguida, o volume individual das árvores foi calculado usando a fórmula \(v_i = \dfrac{(\pi d^2)}{40000}(h)(0,7)\).
  • O dados obtidos por simulação estão disponíveis no arquivo Khaya-simulado.xlsx.

Na simulação, as seguintes características foram admitidas para a população florestal:

  • A população florestal de 🌳Khaya Ivorensis🌳 possui 15 anos de idade, e foi implantada usando o espaçamento 5m x 5m e pleno sol. Sob este espaçamento são possíveis estabelecer até 400 árvores por hectare.
  • A população florestal é um retângulo de 500m x 200m, ou seja, com área total de 10 hectares. (Obviamente, na natureza ter-se-á polígonos irregulares!)
  • A população florestal será subdividida em áreas de 100m x 100m (1 hectare). Portanto, o número de parcelas possíveis na população será igual a 10 (N = 10).
  • Não ocorreu mortalidade no plantio até os 15 anos de idade (Um sonho!😀). Portanto, a população de 🌳Khaya Ivorensis🌳 será composta de 4000 árvores.
  • O intervalo de variação dos diâmetros a 1,30m do solo na população é de 25cm (mínimo) a 27cm (máximo).
  • O intervalo de variação das alturas comerciais na população é de 9m (mínimo) a 10m (máximo).

2 Objetivos

  • Usar os dados simulados para a população florestal de 🌳Khaya Ivorensis🌳 (Simulação de Dados Dendrométricos) para entender a diferença entre o desvio padrão e o erro padrão da média.
  • Demonstrar alguns pacotes e funções disponíveis na linguagem R.

3 Carrega os dados simulados

## Carrega os dados simulados

data <- readxl::read_excel('data/Khaya-simulado.xlsx')
## Visualiza as 2 primeiras linhas de cada parcela

library(dplyr)

data %>%
  group_by(Parc) %>%
  top_n(n = 2) %>% 
  knitr::kable()
Parc d h v
P1 30.77 12.1 0.6298
P1 30.40 11.9 0.6046
P2 30.80 11.4 0.5946
P2 30.20 11.2 0.5616
P3 29.46 11.7 0.5583
P3 29.12 11.5 0.5361
P4 31.04 12.1 0.6409
P4 30.74 11.9 0.6182
P4 30.74 11.9 0.6182
P5 28.88 11.3 0.5182
P5 28.66 11.2 0.5058
P6 29.98 12.5 0.6177
P6 29.87 12.4 0.6082
P7 28.67 12.5 0.5649
P7 28.29 12.2 0.5368
P8 29.09 12.0 0.5583
P8 28.76 11.7 0.5320
P9 30.08 12.1 0.6019
P9 29.84 11.9 0.5825
P10 30.55 11.3 0.5798
P10 30.53 11.3 0.5791

4 Desvio Padrão (Amostral vs Populacional)

## Calcula total do volume por Parcela

v_Parc <- data %>%
  group_by(Parc) %>%
  summarise(across(#.cols = where(is.numeric),
                   .cols = v,
                   .fns = list(Total=sum),
                   na.rm = TRUE,
                   .names = "Volume_{.fn}"
  )
  )
Warning: There was 1 warning in `summarise()`.
ℹ In argument: `across(.cols = v, .fns = list(Total = sum), na.rm = TRUE,
  .names = "Volume_{.fn}")`.
ℹ In group 1: `Parc = "P1"`.
Caused by warning:
! The `...` argument of `across()` is deprecated as of dplyr 1.1.0.
Supply arguments directly to `.fns` through an anonymous function instead.

  # Previously
  across(a:b, mean, na.rm = TRUE)

  # Now
  across(a:b, \(x) mean(x, na.rm = TRUE))
  knitr::kable(v_Parc)
Parc Volume_Total
P1 148.2770
P10 138.4670
P2 141.5700
P3 145.2732
P4 145.1927
P5 131.7152
P6 140.4924
P7 143.0535
P8 134.0941
P9 150.7709
  • Uma vez que os dados da população florestal estão disponíveis, os parâmetros \(\mu\) e \(\sigma\) são conhecidos:
## Média e desvio padrão populacional da variável "volume por hectare"

data %>%
  summarise(n = n(),
            media_pop = mean(v_Parc$Volume_Total), 
            sd_pop = sd(v_Parc$Volume_Total)
            )
  • A média populacional \((\mu)\) para a variável volume é \(141,8906~(m^3.ha^{⁻1})\) e o desvio da população \((\sigma)\) é aproximadamente \(5,98~(m^3.ha^{⁻1})\).
  • O volume por parcela (1ha) para todas as parcelas possíveis na população também é conhecido. Simplesmente por que foram simulados!😀
  • Por enquanto, guarde essas informações!

5 Erro Padrão da Média

  • Para os dados simulado, a média populacional \((\mu)\) para a variável volume é \(141,8906~(m^3.ha^{⁻1})\) e o desvio da população é aproximadamente \(5,98~(m^3.ha^{⁻1})\). (Porém, lembre-se que dados populacionais raramente estarão disponíveis!)
  • Portanto, em inventários florestais (IF), na prática, comumente os dados dendrométricos são medidos em parcelas amostrais sob algum processo de amostragem e, em seguida, a variável de interesse é extrapolada para a população (inferência).
  • Agora, suponha a decisão de sortear uma amostra aleatória sem reposição de duas parcelas amostrais. Aplicando a fórmula da combinação simples (n = 10, k = 2) existem 45 possibilidades de combinação. (Ver tutorial Combinação Simples no R)
## Carrega os dados simulados

#dt$v.soma
#x <- t(combn(dt$v.soma, 2))
#class(x)