Dados para o exercício

Neste exercício, usaremos dados publicados sobre efeitos de kelp gigante na estrutura de comunidades bentônicas. O artigo está no final dos exercícios. Replicaremos as análises da figura 5. Os dados estão no pacote semeco:

library(semeco)
data(arkema)
arkema <- arkema[, -c(1:3)]
  1. Qual o número máximo de parâmetros que poderiam ser estimados com os dados disponibilizados?
  2. Os dados não seguem uma distribuição normal multivariada, como os próprios autores disseram em um dos materiais suplementares do artigo. Utilize a função mardiaTest do pacote MVN para confirmar que os dados realmente não seguem uma distribuição normal multivariada.
  3. Há possíveis outliers nos dados? Para fazer isso, padronize os dados e veja se todos os valores das variáveis estão dentro do esperado (Z >= 3 e Z <= -3). A função que padroniza os dados é a scale.
  4. Há indicação de multicolinearidade? Utilize a matriz de correlação e, se preciso, a função vif do pacote car.
  5. Todas as covariâncias estão dentro do esperado?
sds <- sqrt(diag(cov(arkema)))
max.cov <- outer(sds, sds)
max.cov < cov(arkema)
  1. Construa o modelo usando a sintaxe do lavaan. Caso tenha dificuldade, veja o modelo construído com o comando:
cat(arkema.model)
  1. Encontre os parâmetros e determine o ajuste do modelo com a função sem do pacote lavaan. Utilize o argumento estimator = "MLM" para usar um estimador robusto e levar em consideração que os dados não seguem uma normal multivariada.
  2. O modelo foi capaz de explicar os dados? Por quê?
  3. Os coeficientes padronizados e não padronizados são iguais aos publicados?
  4. Utilize a função inspect para determinar os R^2 das variáveis endógenas.


gustavobio/semeco documentation built on May 17, 2019, 9:29 a.m.