title: "Notas Funcionamiento" author: "Antonio J Perez-Luque" date: "r Sys.Date()" output: pdf_document bibliography: REFERENCES.bib csl: ecology.csl

library("rgbif")
library("dplyr")
library("ggplot2")

Establecer los valores iniciales de la Riqueza

Plantaciones

La riqueza inicial se computará en función de:

$$ Riqueza \sim RiquezaPotencial \times fc $$ siendo RiquezaPotencial un valor obtenido aleatoriamente entre 12.82 - 13.34 (valores potenciales de riqueza, ver [@GomezAparicio2009; @PerezLuque2014]); y fc un factor de correción que tiene en cuenta

$$ fc = w_1 \cdot Reg + w_2 \cdot DistanciaFuenteSemillera + w_3 \cdot TreeDensity $$

Los pesos que he asignado dentro de la función initRichness son: :red_circle:

$$ fc = 0.1 \cdot Reg + 0.35 \cdot DistanciaFuenteSemillera + 0.45 \cdot TreeDensity $$

~ Densidad (Tree density)

La riqueza y diversidad de especies están fuertemente condicionadas por el factor climático (altitud y/o radiación anual) y por la densidad de la plantación [@GomezAparicio2009].

La densidad tiene un efecto negativo en la diversidad y en la riqueza total de especies que encontramos bajo pinares de repoblación, decreciendo éstas al aumentar la densidad de la plantación [@GomezAparicio2009]. La menor diversidad observada en pinares, probablemente se debe a la alta densidad de los pinares en comparación con los bosques naturales, lo que implica unos niveles de luz menor bajo el dosel arbóreo, y esto implica menor diversidad de especies de herbáceas.

Además, de forma general, la abundancia y riqueza de aves dispersantes se ve afectada negativamente con altas densidades de árboles (sobre todo para el arrendajo), reduciendo el flujo de semillas que entran en las plantaciones, y por tanto la potencial diversidad dentro de estas.

La riqueza potencial se ve afectada por la densidad de pinar. Así, según la Eq. 3 de [@GomezAparicio2009], la riqueza potencial se ve afectada en función de la densidad, del siguiente modo:

$$ ftreeden = \exp \left [ -\frac{1}{2} \left( \frac{ treeDensity - 0.22} {1504.1} \right )^2\right ] $$

~ Regenerado

Variables

El regenerado de Quercus en las plantaciones depende del uso del suelo en el pasado, de la distancia a la fuente semillera y de la densidad de la plantación [@Navarro2013; @GomezAparicio2009]. Sabemos que la regeneración de quercíneas en pinares depende mas del uso del suelo que de la densidad de la plantación y que la distancia a la fuente semillera (ver tabla 2 en @Navarro2013).

Para cuantificar la importancia de cada una de las variables, vamos a atender a los valores de varianza explicada por cada uno de los modelos para cada variable. Posteriormente reescalamos la importancia de cada variable y obtenemos:

| variable (Navarro-Gónzalez et al. 2013) | Pseudo-R2 | importancia - reescalada | |-----------------------------------------|-----------|--------------------------| | past Land Use | 0.1238 | 0.4767 | | Propagule source distance | 0.0832 | 0.3204 | | Pine density | 0.0057 | 0.2029 |

Por tanto, podemos hablar que el regenerado de quercíneas bajo pinares de repoblación se rige por

$$ reg \sim 0.4767 \cdot landUse + 0.3204 \cdot Distance + 0.2029 \cdot Density $$

Otra opción es solamente tener en cuenta el uso en el pasado, ya que la distancia a la fuente semillera y la densidad se van a considerar (para la estimación de la riqueza). (Ver issue #12). Optamos por esta última opción.

Aportación de las quercíneas a la riqueza total

Por otro lado hemos de analizar la aportación del regenerado de Quercus a la riqueza que encontramos en las plantaciones. Para ello utilizamos SINFONEVADA [@PerezLuque2014].

Del total de la riqueza observada en las parcelas de SINFONEVADA, analizamos cuanto se debe a la aportación de especies de Quercus:

### uuid of Sinfonevada
sinfo_uuid <- 'db6cd9d7-7be5-4cd0-8b3c-fb6dd7446472'

### See metadata
sinfo_meta <- datasets(uuid = sinfo_uuid)

# Get table of ocurrences
sf <- occ_data(datasetKey=sinfo_meta$data$key, limit = 8000)


# Get only the fields of interest  
df <- sf$data %>% dplyr::select(decimalLatitude, decimalLongitude, scientificName)

# How many species by plot
richness_loc <- df %>%
  group_by(decimalLatitude, decimalLongitude) %>% 
  count() %>% 
  as.data.frame() %>% 
  tibble::rownames_to_column(var='id_plot') %>%
  rename(rich = n)

# Get number of quercus species by plot 
q <- df %>%
  filter(grepl("Quercus", scientificName)) %>% 
  group_by(decimalLatitude, decimalLongitude) %>% 
  count() %>% 
  as.data.frame() %>% 
  rename(rich_quercus = n)

# Get total richness by plot 
richness_tot <- df %>%
  group_by(decimalLatitude, decimalLongitude) %>% 
  count() %>% 
  as.data.frame() %>% 
  rename(rich_total = n)

per_quercus_plot <- richness_tot %>% 
  inner_join(q, by=c('decimalLatitude', 'decimalLongitude')) %>% 
  mutate(per = rich_quercus / rich_total)
per_quercus_plot %>% ggplot(aes(per)) + geom_histogram() +
  xlab('% Quercus species by plot')
per_quercus_plot %>% 
  summarise(mean = mean(per),
            min = min(per), 
            max = max(per), 
            median = median(per))

Las quercínes aportan (como promedio) a la riqueza de la parcela en torno al 9 % (9.08), por lo tanto, deberíamos ajustar la aportación de el uso del suelo a la riqueza de las parcelas de pinar. Así en la función initRichness el peso del uso del suelo en la riqueza está ponderado a un 10 %

Uso del suelo

El valor de riqueza de una plantacion está condicionado por el uso del suelo en el pasado [@Navarro2013], ya que la probabilidad de encontrar reclutas de especies de Quercus dentro de un pinar depende entre otras del uso del suelo en el pasado de esa repoblación.

[@Navarro2013] diferencian entre la probabilidad de encontrar regeneración en una plantación de pinar y la cantidad de regerenación (número de reclutas) que se encuentra dentro de dicha plantación. En nuestro caso, nos interesa mas la probabilidad de encontrar regeneración, mas que la abundancia. De tal forma tenemos que:

| Past Land Use | odds Ratio | rescaleValue | reverse Rescale Value | |-------------------------|------------|--------------|-----------------------| | Oak formation | 0.3935 | 0.0001 | 0.9999 | | Mid-mountain Shrubland | 1.7576 | 0.5018 | 0.4982 | | Pasture | 3.1119 | 0.9999 | 0.0001 | | Cropland | 3.0362 | 0.9720 | 0.0279 |

donde, la probabilidad reescalada de encontrar regeneración en función del uso del suelo sigue el siguiente gradiente: Encinar (0.9999) > Matorrales (0.4982) > Cultivos (0.0279) > Pastizales (0.0001).

En nuestro modelo, la cantidad de regenerado no afecta a la riqueza, sino simplemente la presencia y/o ausencia de regenerado, por lo tanto utilizaremos solamente la probabilidad reescalada de encontrar regeneración para incluir el uso del suelo en el pasado.

Ojo, todos estos valores son para una misma distancia y una densidad media de 750 pinos / ha.

~ Distancia a la fuente semillera

La dispersión de semillas depende de la distancia a la fuente semillera [@Hewitt2002]. En los pinares de repoblación la presencia y abundancia de especies diferentes a los pinos, está determinanda entre otras por la distancia a la fuente semillera [@Gonzalez2011], aunque no es la única razón que explica la diversidad observada en los pinares de repoblación.

@Gonzalez2011 determinaron que, de los diferentes tipos de vegetación considerados, los bosques naturales de quercíneas son los mas influyentes en cuanto a la distancia a la fuente semillera. Así distancias mas cortas podrían incrementar el pool de especies en las plantaciones y reducir la uniformidad de estas.

En concreto, la relación encontrada entre la distancia y la diversidad observada en las plantaciones de pinos se rige por la siguiente ecuación:

## Comment: 
# La ecuación no está en el paper 
# Le pregunté a Pablo si tenía la ecuación a mano (Respuesta = disco duro roto) 
# Tenemos copia de su TFM:
# - Digitalizar plot A pág 27 
# - Usar app para obtener los datos
# - Obtener coef regression

df <- read.csv('diversity_distance.csv', header=TRUE)

# df %>% ggplot(aes(y=SH, x=wdhOak)) + geom_point() + geom_smooth(method = 'lm')

# Fit a linear model
## using raw values of plot (double square root transformed: wdhOak)
m1 <- lm(SH ~ wdhOak, data=df)

## using data reverse transformed
m2 <- lm(SH ~ dist, data=df)

# Get coefficients
coef(m1)
coef(m2)

esto es: $$ Diversity = 1.7605 - 0.0932 * \sqrt{\sqrt{Distance}}$$

Para cada pixel de pinar se computan las distancias entre su centroide y los bordes de las formaciones de bosques naturales, mediante la función dist2nf. Posteriormente, para los pixeles de pinar se computa el valor de diversidad potencial según la ecuación anterior y se reescalan los valores entre 0 y 1.

Dispersal module

Elementos a considerar (sensu [@Nathan2012]:

Seed source

Aspecto cualitativo

Por tanto, ¿cuantas especies potencialmente pueden dispersar?.

@Mendoza2009 habla de que en la zona de estudio hay hasta 20 especies de fruto carnoso. @GomezAparicio2009 ofrece datos de riqueza potencial para encinares y robledales:

issue #13

Aspecto cuantitativo

Disperser

Tipos

Vamos a considerar tres tipos de dispersores (zoócoros):

Cuanta cantidad de dispersores?

El usuario podrá decidir el porcentaje de cada tipo de dispersor Hemos de tener en cuenta que no son excluyentes, por tanto, en la aplicación haremos que la selección sea sumatoria (ver issue #14)

Características de cada tipo de dispersor

Kernel

Cada tipo de dispersor tiene un kernel de dispersión caracterizado por: modelo y distancia

| tipo | rango | peak | 50 % | |--------------|----------|---------------------|-------| | Small birds | 0 - 100 | | < 51 | | Medium birds | | | > 110 | | Mammals | 0 - 990 | 650 - 700 | > 495 | | Arrendajo | 5 - 1000 | 262.9 (mediana 200) | | | | | 402 (med. 450) | | | | 3 - 550 | 68 | |

Existen varios modelos de kernels.

Kernel Arrendajo

El modelo que mejor se ajusta es:

$$ u^{-1} = 0.14 + 2.17 \log r - 2.50 (\log r)^2 + 0.70 (\log r)^3 $$

siedo $u$ la densidad o porcentaje de vuelos hechos por el arrendajo a una distancia $r$ desde la fuente semillera

$$ u^{-1} = -0.10 + 0.02 r + 0.04 r^2 $$

[@Pons2007] encontró que el mejor kernel de dispersion es el modelo log-normal, con valores medios de 3.844 (location parameter, log-scale) y y una desviación estandar de 0.851 (shape parameter, log-scale)

Kernel Mamíferos

@GonzalezVaro2013 estudió kernels de dispersion para varios mamíferos carnívoros y encontró varios modelos.

Kernel small birds

Kernel medium bird

library(dplyr)
library(ggplot2)
library(fitdistrplus)

# --------------------
# Arrendajo from Gomez 2003 
dis <- c(10, 30, 50, 70, 90, 150, 250, 350, 450, 550, 700, 900)
per <- c(1.07, 1.40, 2.34, 3.78, 9.82, 33.01, 16.11, 11.40, 10.06, 10.33, 4.89, 0.77)
df <- data.frame(cbind(dis, per))

df <- df %>% 
  mutate(k = -0.1 + 0.02*log(dis) + 0.04*(log(dis^2)),
         u = 1/k) 

df %>% ggplot(aes(x=dis, y=u)) + geom_point() + geom_smooth()

# Fit a lognormal and weibull
arre_lnorm <- fitdist(df$per, "lnorm")
arre_w <-  fitdist(df$per, "weibull")
# -------------------- 



grid <- seq(0,1500,1)
# Arrendajo (Pons & Pausas 2007)
plot(dlnorm(grid,meanlog = 3.844, sdlog = 0.851), col='blue', 
     type="l")

# kernel para mamíferos González-Varo et al. 2012 http://onlinelibrary.wiley.com/doi/10.1111/1365-2656.12024/full
lines(grid, 
      ifelse(grid <= 400,
             dweibull(grid, shape = 1.385, scale = 137),
             dlnorm(grid, meanlog = 6.621, sdlog = 0.297)),
      type="l",xlab="x",ylab="f(x)", col='red')


lines(grid, 
      dlnorm(grid, meanlog = log(200), 
               sdlog= arre_lnorm$estimate["sdlog"]), col='blue', 
      lty=2)

lines(grid, 
      dweibull(grid, 
               shape = arre_w$estimate["shape"], 
               scale = 88),
      col='blue', lty=6)


lines(grid, 
      dlnorm(grid,meanlog = arre_lnorm$estimate["meanlog"], 
             sdlog= arre_lnorm$estimate["sdlog"]), col='blue', 
      lty=2)

dis <- data.frame(d = seq(1,1000, b=1))

dis <- dis %>% 
  mutate(k = -0.1 + 0.02*d + 0.04*(d^2), 
         u = 1/k,
         u2 = 1/(-0.1 - 0.02*(log(d)) + 0.04*((log(d))^2)),
         gu = 1/(0.14 - 2.17*(log(d)) - 2.50*((log(d))^2) + 0.7*((log(d))^3))) 

dis %>% filter(u > 0) %>% 
  ggplot(aes(x=d, y=gu)) + geom_line()

#### Proposal 

data <- data.frame(
  dis = seq(0,1500,1))

data <- data %>% 
  mutate(
    sb = dlnorm(dis, meanlog = log(51), sdlog = .9), 
    mb = dlnorm(dis, meanlog = log(151), sdlog = 1),
    ma = ifelse(dis <= 400,
                dweibull(dis, shape = 1.385, scale = 137),
                dlnorm(dis, meanlog = 6.621, sdlog = 0.297)),
    gg = dlnorm(dis, meanlog = log(450), sdlog = 1))


data %>% ggplot(aes(x=dis)) + 
  geom_line(aes(x=dis, y=sb), color='blue') +
  geom_line(aes(x=dis, y=mb), color='black') +
  geom_line(aes(x=dis, y=ma), color='red') +
  geom_line(aes(x=dis, y=gg), color='green') + 
  scale_x_continuous(breaks = seq(0,1500, 100)) + 
  theme_bw() + 
  theme(panel.grid = element_blank()) +
  ylab('f(x)') + 
  annotate("text", 
           x= 1000, y = 0.010, 
           label=("blue = sb, red = ma, black=mb, green = gg"))

issue #15

Cuanto dispersa cada dispersor

Sabemos que los mamíferos dispersan menos cantidad que los pájaros. El propagule input es de 95 % para los pájaros (3.7 seeds/m2 year) y de solo el 5 % para los mamíferos [@Zamora2010]. Habría que considerar alguna manera de introducir esto. Quizá en el load inicial cuando se elige el dispersor predominante. Quizá pueda servir para modular el avance con el tiempo, sería el propagule input anual

Introducción de nuevas especies

Los mamíferos al ser Long-distance disperser pueden introducir nuevas especies (generalmente agrícolas)

End-point (target)

¿Como modelar el contexto?

Propuesta:

Medir la adjacencia y aumentar la probabilidad de aumentar la riqueza en función de la adjacencia.

References



ajpelu/respine documentation built on May 14, 2019, 8:19 a.m.