Tenho um banco de dados com 3074 linhas sem missing.
Uma variável dependente binária e mais 42 variáveis independentes também
binárias (todas como fator).
Minha pergunta é quals VIs contribuem para a doença que está em VD.
Meu summary da VD apresenta o seguinte resultado:
summary(data.to.work.train$NMM)
Sem doença Com doença
2715 359
removi as variáveis com alta correlação (multicolinearidade) e fiz uma RL
com todas as variáveis e nada deu signficativo.
Fiz tambem com variáveis individuais e nada de significativo.
A maioria das variáveis apresenta uma prevalência pequena da doença:
Não Sim
Não 2683 32
Sim 353 6
Alguém poderia opinar sobre uma possível solução? Ou outros passos a seguir?
--
*In Jesu et Maria*
*Obrigado*
*Prof. Elias Carvalho*
*"Felix, qui potuit rerum cognoscere causas" (Virgil 29 BC)"Blessed is he
who has been able to understand the cause of things"*
_______________________________________________
R-br mailing list
[email protected]
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código
mínimo reproduzível.