Contextualização (Ainda em construção!)
- No tutorial Simulação
de Dados Dendrométricos foram simulados dados (assumindo
distribuição normal) para as variáveis diâmetro a 1,30m do solo (\(d\)) e altura (\(h\)) para uma população florestal
hipotética de 🌳Khaya Ivorensis🌳 (10 hectares). Em seguida, o
volume individual das árvores foi calculado usando a fórmula \(v_i = \dfrac{(\pi
d^2)}{40000}(h)(0,7)\).
- O dados obtidos por simulação estão disponíveis no arquivo Khaya-simulado.xlsx.
Na simulação, as seguintes características foram admitidas
para a população florestal:
- A população florestal de 🌳Khaya Ivorensis🌳 possui 15 anos
de idade, e foi implantada usando o espaçamento 5m x 5m e pleno sol. Sob
este espaçamento são possíveis estabelecer até 400 árvores por
hectare.
- A população florestal é um retângulo de 500m x 200m, ou seja, com
área total de 10 hectares. (Obviamente, na natureza ter-se-á polígonos
irregulares!)
- A população florestal será subdividida em áreas de 100m x 100m (1
hectare). Portanto, o número de parcelas possíveis na população será
igual a 10 (N = 10).
- Não ocorreu mortalidade no plantio até os 15 anos de idade (Um
sonho!😀). Portanto, a população de 🌳Khaya Ivorensis🌳 será
composta de 4000 árvores.
- O intervalo de variação dos diâmetros a 1,30m do solo na população é
de 25cm (mínimo) a 27cm (máximo).
- O intervalo de variação das alturas comerciais na população é de 9m
(mínimo) a 10m (máximo).

Objetivos
- Usar os dados simulados para a população florestal de 🌳Khaya
Ivorensis🌳 (Simulação
de Dados Dendrométricos) para entender a diferença entre o desvio padrão e o erro padrão da média.
- Demonstrar alguns pacotes e funções disponíveis na linguagem R.
Carrega os dados
simulados
## Carrega os dados simulados
data <- readxl::read_excel('data/Khaya-simulado.xlsx')
## Visualiza as 2 primeiras linhas de cada parcela
library(dplyr)
data %>%
group_by(Parc) %>%
top_n(n = 2) %>%
knitr::kable()
P1 |
30.77 |
12.1 |
0.6298 |
P1 |
30.40 |
11.9 |
0.6046 |
P2 |
30.80 |
11.4 |
0.5946 |
P2 |
30.20 |
11.2 |
0.5616 |
P3 |
29.46 |
11.7 |
0.5583 |
P3 |
29.12 |
11.5 |
0.5361 |
P4 |
31.04 |
12.1 |
0.6409 |
P4 |
30.74 |
11.9 |
0.6182 |
P4 |
30.74 |
11.9 |
0.6182 |
P5 |
28.88 |
11.3 |
0.5182 |
P5 |
28.66 |
11.2 |
0.5058 |
P6 |
29.98 |
12.5 |
0.6177 |
P6 |
29.87 |
12.4 |
0.6082 |
P7 |
28.67 |
12.5 |
0.5649 |
P7 |
28.29 |
12.2 |
0.5368 |
P8 |
29.09 |
12.0 |
0.5583 |
P8 |
28.76 |
11.7 |
0.5320 |
P9 |
30.08 |
12.1 |
0.6019 |
P9 |
29.84 |
11.9 |
0.5825 |
P10 |
30.55 |
11.3 |
0.5798 |
P10 |
30.53 |
11.3 |
0.5791 |
Desvio Padrão (Amostral
vs Populacional)
## Calcula total do volume por Parcela
v_Parc <- data %>%
group_by(Parc) %>%
summarise(across(#.cols = where(is.numeric),
.cols = v,
.fns = list(Total=sum),
na.rm = TRUE,
.names = "Volume_{.fn}"
)
)
Warning: There was 1 warning in `summarise()`.
ℹ In argument: `across(.cols = v, .fns = list(Total = sum), na.rm = TRUE,
.names = "Volume_{.fn}")`.
ℹ In group 1: `Parc = "P1"`.
Caused by warning:
! The `...` argument of `across()` is deprecated as of dplyr 1.1.0.
Supply arguments directly to `.fns` through an anonymous function instead.
# Previously
across(a:b, mean, na.rm = TRUE)
# Now
across(a:b, \(x) mean(x, na.rm = TRUE))
P1 |
148.2770 |
P10 |
138.4670 |
P2 |
141.5700 |
P3 |
145.2732 |
P4 |
145.1927 |
P5 |
131.7152 |
P6 |
140.4924 |
P7 |
143.0535 |
P8 |
134.0941 |
P9 |
150.7709 |
- Uma vez que os dados da população florestal estão disponíveis, os
parâmetros \(\mu\) e \(\sigma\) são conhecidos:
## Média e desvio padrão populacional da variável "volume por hectare"
data %>%
summarise(n = n(),
media_pop = mean(v_Parc$Volume_Total),
sd_pop = sd(v_Parc$Volume_Total)
)
- A média populacional \((\mu)\) para
a variável volume é \(141,8906~(m^3.ha^{⁻1})\) e o desvio da
população \((\sigma)\) é
aproximadamente \(5,98~(m^3.ha^{⁻1})\).
- O volume por parcela (1ha) para todas as parcelas possíveis na
população também é conhecido. Simplesmente por que foram
simulados!😀
- Por enquanto, guarde essas informações!
Erro Padrão da
Média
- Para os dados simulado, a média populacional \((\mu)\) para a variável volume é \(141,8906~(m^3.ha^{⁻1})\) e o desvio da
população é aproximadamente \(5,98~(m^3.ha^{⁻1})\). (Porém, lembre-se que dados populacionais raramente
estarão disponíveis!)
- Portanto, em inventários florestais (IF), na prática, comumente os
dados dendrométricos são medidos em parcelas
amostrais sob algum processo de amostragem e, em seguida, a
variável de interesse é extrapolada para a população (inferência).
- Agora, suponha a decisão de sortear uma amostra aleatória sem
reposição de duas parcelas amostrais. Aplicando a fórmula da combinação
simples (n = 10, k = 2) existem 45 possibilidades de combinação. (Ver
tutorial Combinação
Simples no R)
## Carrega os dados simulados
#dt$v.soma
#x <- t(combn(dt$v.soma, 2))
#class(x)