title: "Notas Funcionamiento"
author: "Antonio J Perez-Luque"
date: "r Sys.Date()
"
output: pdf_document
bibliography: REFERENCES.bib
csl: ecology.csl
library("rgbif") library("dplyr") library("ggplot2")
La riqueza inicial se computará en función de:
$$ Riqueza \sim RiquezaPotencial \times fc $$ siendo RiquezaPotencial un valor obtenido aleatoriamente entre 12.82 - 13.34 (valores potenciales de riqueza, ver [@GomezAparicio2009; @PerezLuque2014]); y fc un factor de correción que tiene en cuenta
$$ fc = w_1 \cdot Reg + w_2 \cdot DistanciaFuenteSemillera + w_3 \cdot TreeDensity $$
Los pesos que he asignado dentro de la función initRichness
son: :red_circle:
$$ fc = 0.1 \cdot Reg + 0.35 \cdot DistanciaFuenteSemillera + 0.45 \cdot TreeDensity $$
La riqueza y diversidad de especies están fuertemente condicionadas por el factor climático (altitud y/o radiación anual) y por la densidad de la plantación [@GomezAparicio2009].
La densidad tiene un efecto negativo en la diversidad y en la riqueza total de especies que encontramos bajo pinares de repoblación, decreciendo éstas al aumentar la densidad de la plantación [@GomezAparicio2009]. La menor diversidad observada en pinares, probablemente se debe a la alta densidad de los pinares en comparación con los bosques naturales, lo que implica unos niveles de luz menor bajo el dosel arbóreo, y esto implica menor diversidad de especies de herbáceas.
Además, de forma general, la abundancia y riqueza de aves dispersantes se ve afectada negativamente con altas densidades de árboles (sobre todo para el arrendajo), reduciendo el flujo de semillas que entran en las plantaciones, y por tanto la potencial diversidad dentro de estas.
La riqueza potencial se ve afectada por la densidad de pinar. Así, según la Eq. 3 de [@GomezAparicio2009], la riqueza potencial se ve afectada en función de la densidad, del siguiente modo:
$$ ftreeden = \exp \left [ -\frac{1}{2} \left( \frac{ treeDensity - 0.22} {1504.1} \right )^2\right ] $$
El regenerado de Quercus en las plantaciones depende del uso del suelo en el pasado, de la distancia a la fuente semillera y de la densidad de la plantación [@Navarro2013; @GomezAparicio2009]. Sabemos que la regeneración de quercíneas en pinares depende mas del uso del suelo que de la densidad de la plantación y que la distancia a la fuente semillera (ver tabla 2 en @Navarro2013).
Para cuantificar la importancia de cada una de las variables, vamos a atender a los valores de varianza explicada por cada uno de los modelos para cada variable. Posteriormente reescalamos la importancia de cada variable y obtenemos:
| variable (Navarro-Gónzalez et al. 2013) | Pseudo-R2 | importancia - reescalada | |-----------------------------------------|-----------|--------------------------| | past Land Use | 0.1238 | 0.4767 | | Propagule source distance | 0.0832 | 0.3204 | | Pine density | 0.0057 | 0.2029 |
Por tanto, podemos hablar que el regenerado de quercíneas bajo pinares de repoblación se rige por
$$ reg \sim 0.4767 \cdot landUse + 0.3204 \cdot Distance + 0.2029 \cdot Density $$
Otra opción es solamente tener en cuenta el uso en el pasado, ya que la distancia a la fuente semillera y la densidad se van a considerar (para la estimación de la riqueza). (Ver issue #12). Optamos por esta última opción.
Por otro lado hemos de analizar la aportación del regenerado de Quercus a la riqueza que encontramos en las plantaciones. Para ello utilizamos SINFONEVADA [@PerezLuque2014].
Del total de la riqueza observada en las parcelas de SINFONEVADA, analizamos cuanto se debe a la aportación de especies de Quercus:
### uuid of Sinfonevada sinfo_uuid <- 'db6cd9d7-7be5-4cd0-8b3c-fb6dd7446472' ### See metadata sinfo_meta <- datasets(uuid = sinfo_uuid) # Get table of ocurrences sf <- occ_data(datasetKey=sinfo_meta$data$key, limit = 8000) # Get only the fields of interest df <- sf$data %>% dplyr::select(decimalLatitude, decimalLongitude, scientificName) # How many species by plot richness_loc <- df %>% group_by(decimalLatitude, decimalLongitude) %>% count() %>% as.data.frame() %>% tibble::rownames_to_column(var='id_plot') %>% rename(rich = n) # Get number of quercus species by plot q <- df %>% filter(grepl("Quercus", scientificName)) %>% group_by(decimalLatitude, decimalLongitude) %>% count() %>% as.data.frame() %>% rename(rich_quercus = n) # Get total richness by plot richness_tot <- df %>% group_by(decimalLatitude, decimalLongitude) %>% count() %>% as.data.frame() %>% rename(rich_total = n) per_quercus_plot <- richness_tot %>% inner_join(q, by=c('decimalLatitude', 'decimalLongitude')) %>% mutate(per = rich_quercus / rich_total)
per_quercus_plot %>% ggplot(aes(per)) + geom_histogram() + xlab('% Quercus species by plot')
per_quercus_plot %>% summarise(mean = mean(per), min = min(per), max = max(per), median = median(per))
Las quercínes aportan (como promedio) a la riqueza de la parcela en torno al 9 % (9.08), por lo tanto, deberíamos ajustar la aportación de el uso del suelo a la riqueza de las parcelas de pinar. Así en la función initRichness
el peso del uso del suelo en la riqueza está ponderado a un 10 %
El valor de riqueza de una plantacion está condicionado por el uso del suelo en el pasado [@Navarro2013], ya que la probabilidad de encontrar reclutas de especies de Quercus dentro de un pinar depende entre otras del uso del suelo en el pasado de esa repoblación.
[@Navarro2013] diferencian entre la probabilidad de encontrar regeneración en una plantación de pinar y la cantidad de regerenación (número de reclutas) que se encuentra dentro de dicha plantación. En nuestro caso, nos interesa mas la probabilidad de encontrar regeneración, mas que la abundancia. De tal forma tenemos que:
| Past Land Use | odds Ratio | rescaleValue | reverse Rescale Value | |-------------------------|------------|--------------|-----------------------| | Oak formation | 0.3935 | 0.0001 | 0.9999 | | Mid-mountain Shrubland | 1.7576 | 0.5018 | 0.4982 | | Pasture | 3.1119 | 0.9999 | 0.0001 | | Cropland | 3.0362 | 0.9720 | 0.0279 |
donde, la probabilidad reescalada de encontrar regeneración en función del uso del suelo sigue el siguiente gradiente: Encinar (0.9999) > Matorrales (0.4982) > Cultivos (0.0279) > Pastizales (0.0001).
En nuestro modelo, la cantidad de regenerado no afecta a la riqueza, sino simplemente la presencia y/o ausencia de regenerado, por lo tanto utilizaremos solamente la probabilidad reescalada de encontrar regeneración para incluir el uso del suelo en el pasado.
Ojo, todos estos valores son para una misma distancia y una densidad media de 750 pinos / ha.
La dispersión de semillas depende de la distancia a la fuente semillera [@Hewitt2002]. En los pinares de repoblación la presencia y abundancia de especies diferentes a los pinos, está determinanda entre otras por la distancia a la fuente semillera [@Gonzalez2011], aunque no es la única razón que explica la diversidad observada en los pinares de repoblación.
@Gonzalez2011 determinaron que, de los diferentes tipos de vegetación considerados, los bosques naturales de quercíneas son los mas influyentes en cuanto a la distancia a la fuente semillera. Así distancias mas cortas podrían incrementar el pool de especies en las plantaciones y reducir la uniformidad de estas.
En concreto, la relación encontrada entre la distancia y la diversidad observada en las plantaciones de pinos se rige por la siguiente ecuación:
## Comment: # La ecuación no está en el paper # Le pregunté a Pablo si tenía la ecuación a mano (Respuesta = disco duro roto) # Tenemos copia de su TFM: # - Digitalizar plot A pág 27 # - Usar app para obtener los datos # - Obtener coef regression df <- read.csv('diversity_distance.csv', header=TRUE) # df %>% ggplot(aes(y=SH, x=wdhOak)) + geom_point() + geom_smooth(method = 'lm') # Fit a linear model ## using raw values of plot (double square root transformed: wdhOak) m1 <- lm(SH ~ wdhOak, data=df) ## using data reverse transformed m2 <- lm(SH ~ dist, data=df) # Get coefficients coef(m1) coef(m2)
esto es: $$ Diversity = 1.7605 - 0.0932 * \sqrt{\sqrt{Distance}}$$
Para cada pixel de pinar se computan las distancias entre su centroide y los bordes de las formaciones de bosques naturales, mediante la función dist2nf
. Posteriormente, para los pixeles de pinar se computa el valor de diversidad potencial según la ecuación anterior y se reescalan los valores entre 0 y 1.
Elementos a considerar (sensu [@Nathan2012]:
Mayor diversidad de especies en la fuente semillera, mayor diversidad de semillas
Cualitativamente mamíferos y aves frugívoras dispersan semillas de especies similares [@Zamora2010].
Aproximadamente la mitad de las especies leñosas de fruto carnoso en el área de estudio son dispersadas por los vectores (mamíferos y/o aves) [@Zamora2010 @Matias2010 @Mendoza2009]
Por tanto, ¿cuantas especies potencialmente pueden dispersar?.
@Mendoza2009 habla de que en la zona de estudio hay hasta 20 especies de fruto carnoso. @GomezAparicio2009 ofrece datos de riqueza potencial para encinares y robledales:
Vamos a considerar tres tipos de dispersores (zoócoros):
El usuario podrá decidir el porcentaje de cada tipo de dispersor Hemos de tener en cuenta que no son excluyentes, por tanto, en la aplicación haremos que la selección sea sumatoria (ver issue #14)
Cada tipo de dispersor tiene un kernel de dispersión caracterizado por: modelo y distancia
Small birds [@Jordano2007 @Zamora2010]:
Medium birds:
Mammals [@Jordano2007 @Matias2010]
Arrendajo [@Gomez2003 @Pons2007]
| tipo | rango | peak | 50 % | |--------------|----------|---------------------|-------| | Small birds | 0 - 100 | | < 51 | | Medium birds | | | > 110 | | Mammals | 0 - 990 | 650 - 700 | > 495 | | Arrendajo | 5 - 1000 | 262.9 (mediana 200) | | | | | 402 (med. 450) | | | | 3 - 550 | 68 | |
Existen varios modelos de kernels.
En general la curva tiene 2 picos: uno local dentro del mismo parche de vegetación (oak patch) (1-20 m) y otro a larga distancia hacia pinares (ca 200 m) [@Gomez2003]. Podríamos hablar de un proceso estratificado, dependiente del sitio y condicionado por la alta heterogeneidad del paisaje.
El segundo pico es mucho mayor que el primero, lo cual es contrario a la mayoría de los casos reportados donde a partir de una determinada distancia disminuyen la frecuencia.
El modelo que mejor se ajusta es:
$$ u^{-1} = 0.14 + 2.17 \log r - 2.50 (\log r)^2 + 0.70 (\log r)^3 $$
siedo $u$ la densidad o porcentaje de vuelos hechos por el arrendajo a una distancia $r$ desde la fuente semillera
$$ u^{-1} = -0.10 + 0.02 r + 0.04 r^2 $$
[@Pons2007] encontró que el mejor kernel de dispersion es el modelo log-normal, con valores medios de 3.844 (location parameter, log-scale) y y una desviación estandar de 0.851 (shape parameter, log-scale)
@GonzalezVaro2013 estudió kernels de dispersion para varios mamíferos carnívoros y encontró varios modelos.
library(dplyr) library(ggplot2) library(fitdistrplus) # -------------------- # Arrendajo from Gomez 2003 dis <- c(10, 30, 50, 70, 90, 150, 250, 350, 450, 550, 700, 900) per <- c(1.07, 1.40, 2.34, 3.78, 9.82, 33.01, 16.11, 11.40, 10.06, 10.33, 4.89, 0.77) df <- data.frame(cbind(dis, per)) df <- df %>% mutate(k = -0.1 + 0.02*log(dis) + 0.04*(log(dis^2)), u = 1/k) df %>% ggplot(aes(x=dis, y=u)) + geom_point() + geom_smooth() # Fit a lognormal and weibull arre_lnorm <- fitdist(df$per, "lnorm") arre_w <- fitdist(df$per, "weibull") # -------------------- grid <- seq(0,1500,1) # Arrendajo (Pons & Pausas 2007) plot(dlnorm(grid,meanlog = 3.844, sdlog = 0.851), col='blue', type="l") # kernel para mamíferos González-Varo et al. 2012 http://onlinelibrary.wiley.com/doi/10.1111/1365-2656.12024/full lines(grid, ifelse(grid <= 400, dweibull(grid, shape = 1.385, scale = 137), dlnorm(grid, meanlog = 6.621, sdlog = 0.297)), type="l",xlab="x",ylab="f(x)", col='red') lines(grid, dlnorm(grid, meanlog = log(200), sdlog= arre_lnorm$estimate["sdlog"]), col='blue', lty=2) lines(grid, dweibull(grid, shape = arre_w$estimate["shape"], scale = 88), col='blue', lty=6) lines(grid, dlnorm(grid,meanlog = arre_lnorm$estimate["meanlog"], sdlog= arre_lnorm$estimate["sdlog"]), col='blue', lty=2) dis <- data.frame(d = seq(1,1000, b=1)) dis <- dis %>% mutate(k = -0.1 + 0.02*d + 0.04*(d^2), u = 1/k, u2 = 1/(-0.1 - 0.02*(log(d)) + 0.04*((log(d))^2)), gu = 1/(0.14 - 2.17*(log(d)) - 2.50*((log(d))^2) + 0.7*((log(d))^3))) dis %>% filter(u > 0) %>% ggplot(aes(x=d, y=gu)) + geom_line() #### Proposal data <- data.frame( dis = seq(0,1500,1)) data <- data %>% mutate( sb = dlnorm(dis, meanlog = log(51), sdlog = .9), mb = dlnorm(dis, meanlog = log(151), sdlog = 1), ma = ifelse(dis <= 400, dweibull(dis, shape = 1.385, scale = 137), dlnorm(dis, meanlog = 6.621, sdlog = 0.297)), gg = dlnorm(dis, meanlog = log(450), sdlog = 1)) data %>% ggplot(aes(x=dis)) + geom_line(aes(x=dis, y=sb), color='blue') + geom_line(aes(x=dis, y=mb), color='black') + geom_line(aes(x=dis, y=ma), color='red') + geom_line(aes(x=dis, y=gg), color='green') + scale_x_continuous(breaks = seq(0,1500, 100)) + theme_bw() + theme(panel.grid = element_blank()) + ylab('f(x)') + annotate("text", x= 1000, y = 0.010, label=("blue = sb, red = ma, black=mb, green = gg"))
Sabemos que los mamíferos dispersan menos cantidad que los pájaros. El propagule input es de 95 % para los pájaros (3.7 seeds/m2 year) y de solo el 5 % para los mamíferos [@Zamora2010]. Habría que considerar alguna manera de introducir esto. Quizá en el load inicial cuando se elige el dispersor predominante. Quizá pueda servir para modular el avance con el tiempo, sería el propagule input anual
Los mamíferos al ser Long-distance disperser pueden introducir nuevas especies (generalmente agrícolas)
¿Como modelar el contexto?
Propuesta:
Medir la adjacencia y aumentar la probabilidad de aumentar la riqueza en función de la adjacencia.
Add the following code to your website.
For more information on customizing the embed code, read Embedding Snippets.