Muito obrigado pessoal!
Mas agora tenho outra questão. Minha base inicial possui 476.430
observações de 20 variáveis.
Quando faço as dummies fico com (Além do inicial):
* Dois arquivos de dimensões: 476.430 161
*Dois arquivos de dimensões: 476.430 3.059
Portanto, não estou conseguindo criar a base final. Pois quando tento
criar a quarta e última dummy dá a mensagem de que não é possível alocar
o vetor de 10,9 GB.
Já li que posso resolver o problema de memória definindo que o R não irá
carregar a base, mas sim, irá lê-la diretamente do HD. Mas realmente é
possível?
Alguém saberia me dizer?
Configurações da minha máquina:
Core i7 com 8 núcleos
HD 1T
8 GB de RAM
Desde já muito obrigado!
On 02/04/2015 11:32, walmes . wrote:
Converta para fator que automaticamente a model.matrix() vai gerar as
dummies para você.
x <- gl(5, 3, labels=LETTERS[1:5])
is.factor(x)
class(x)
levels(x)
nlevels(x)
model.matrix(~x)
y <- rnorm(length(x))
lm(y~x)
À disposição.
Walmes.
_______________________________________________
R-br mailing list
[email protected]
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código
mínimo reproduzível.
--
*Alexandre Rodrigues Loures*
Doutorando em Economia Aplicada
Universidade Federal da Paraíba - UFPB
Centro de Ciências Sociais Aplicadas - CCSA
Programa de Pós-Graduação em Economia - PPGE
e-Mail: [email protected]
Site: www.ccsa.ufpb.br/ppge
_______________________________________________
R-br mailing list
[email protected]
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código
mínimo reproduzível.