Em Qui 25 jun. 2015, às 15:49, Karen Castillioni escreveu:
> Pessoal,
 estou tentando analisar dados de cobertura vegetal (5%, 10%, 15%,
 20%..até 100%) e dados de biomassa (em gramas por m2) usando glm, pois
 nenhum dos dados apresenta distribuição normal, nem mesmo com
 transformação. Porém, estou em dúvida sobre qual família usar para cada
 variável.  Alguém pode ajudar?
> Agradeço a ajuda.
> _________________________________________________
> R-br mailing list [email protected]
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia
> de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo
> reproduzível.

O que precisa ter distribuição normal (ou binomial, ou Poisson, ...) é o
resíduo, e não as variáveis explanatórias ou de resposta.

A página de ajuda para *family* lista as famílias de distribuição
prontamente disponíveis. As distribuições "quasi" têm seus intervalos de
confiança e valores p ajustados por um fator de dispersão, evitando que
sejam invalidados por superdispersão (por exemplo, caso você queria
utilizar poisson ou binomial). Se a sua variável de resposta for a
cobertura vegetal, você provavelmente vai querer utilizar a família
*quasibinomial(link = "identity")* para um modelo aditivo, ou
*quasipoisson* para um modelo multiplicativo.

Existem outras formas de conseguir intervalos de confiança e valores p
válidos quando a distribuição não segue o esperado. Não sei trabalhar
com estimação "sanduíche" da variância no R, mas sei que dá para usar
bootstrap (http://www.ats.ucla.edu/stat/r/library/bootstrap.htm).

Espero ter ajudado.

Leonardo Ferreira Fontenelle[1]





Links:

  1. http://lattes.cnpq.br/9234772336296638
_______________________________________________
R-br mailing list
[email protected]
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código 
mínimo reproduzível.

Responder a