Pessoal, acho que contornei o problema. Quando eu importo o txt em xlsx e só depois passo para o csv aparentemente fica tudo ok. Salvei a coluna do código como texto e quando abro no R, salvo como factor como o Daniel me sugeriu. Vou tentar levar assim. Do jeito que estão as coisas por aqui não vou defender nunca. Muito obrigada a todos. Sem vocês minha tese iria para o lodo. Abs Fátima
Em 20 de abril de 2013 14:08, Daniel Marcelino <[email protected]>escreveu: > De fato, existe uma limitação da memória, se sua planilha for muito grande > o java não conseguira concluir a leitura. > A dica do Manoel é a mais sensata e vai evitar todos esses problemas de > leitura e etc. Tudo o que você precisa criar é um workflow de como abrir e > salvar os seus dados no R. > > Abaixo vou postar uma solução, mas isso vai depender da sua máquina: > > > options(java.parameters = "-Xmx1000m") > > Você também pode usar gc() depois de cada leitura, casa há várias. > > Daniel > > > 2013/4/20 Manoel Galdino <[email protected]> > >> é problema da memória virtual do java. Tem que setar a memória virtual do >> java. Tive esse problema uns tempos atrás, mas não lembro como fiz (e foi >> em linux, não windows). >> >> Mas não deveria ser necessário ler direto do excel. Tente salvar o >> arquivo como txt ao invés de csv. E quando usar read.table, use o argumento >> colclasses. Sete tudo para character e aí, depois no R, você converte pra >> numeric se necessário. >> Lembrabndo que um número 3.05e12 é só uma forma de imprimir na tela. Na >> memória o número está salvo corretamente. >> >> Mas a questão principal é: quantos algarismos têm seus números e que >> operações você precisa fazer nele? >> >> Sem isso e um exemplo reproduzível fica difícil ajudar. >> abç >> M >> >> >> >> 2013/4/20 Fátima Lima Paula <[email protected]> >> >>> Pessoal, tentei abrir com o pacote xlsx. Deu erro: >>> > data=read.xlsx("sih2008.xlsx",1) >>> Erro em .jcall("RJavaTools", "Ljava/lang/Object;", "invokeMethod", cl, >>> : >>> java.lang.OutOfMemoryError: Java heap space >>> >>> >>> >>> Em 20 de abril de 2013 00:28, Daniel Marcelino >>> <[email protected]>escreveu: >>> >>> En se tratando de uma variável ID, eu manteria ela como factor ou >>>> character, evitando assim o problema de encolhimento como já dito. >>>> >>>> >>>> >>>> 2013/4/19 Fátima Lima Paula <[email protected]> >>>> >>>>> Pessoal, acho que resolvi. Quando salvo o txt em csv, preciso dizer >>>>> que a coluna desse sódigo é número e não geral. Assim parece que deu >>>>> certo. >>>>> Obrigada a todos. >>>>> >>>>> >>>>> Em 19 de abril de 2013 19:30, Manoel Galdino <[email protected]>escreveu: >>>>> >>>>> Se você puder dar mais informações sobre o banco e o que quer dizer >>>>>> essa variável, pode ajudar. >>>>>> >>>>>> abç >>>>>> M >>>>>> >>>>>> >>>>>> 2013/4/19 Fátima Lima Paula <[email protected]> >>>>>> >>>>>>> Acabei de descobrir que quando eu leio o banco esse número "perde o >>>>>>> final". É um código. Ele tem os primeiros dígitos depois vem vários >>>>>>> zeros e >>>>>>> depois mais alguns dígitos. Estou em desespero. Perdi horas e horas de >>>>>>> trabalho. Vi que é um problema de importação do banco. Nunca havia >>>>>>> trabalhado com bancos grandes. Quando eu peguei o banco, ele veio em >>>>>>> txt. >>>>>>> Deve ter sido na hora que fui abrir no excel. Alguém pode me dar uma >>>>>>> luz em >>>>>>> relação a isso? >>>>>>> Tenho um banco em txt, separado por ponto e vírgula, sem "header". >>>>>>> Como é a melhor forma de trabalhar esse banco no R? >>>>>>> Obrigada >>>>>>> >>>>>>> >>>>>>> Em 19 de abril de 2013 18:21, Leandro Marino < >>>>>>> [email protected]> escreveu: >>>>>>> >>>>>>> Em um número deste tamanho consideraria transformar para character. >>>>>>>> Fatalmente é um código de município. >>>>>>>> >>>>>>>> Já tive problemas em números inteiros largos na hora de fazer o >>>>>>>> merge uma vez que eles são interpretados como pontos flutuantes.... >>>>>>>> >>>>>>>> Tive dois números que apesar de serem diferentes na hora do merge >>>>>>>> eram juntados.... >>>>>>>> Em 19/04/2013 17:24, "Fátima Lima Paula" < >>>>>>>> [email protected]> escreveu: >>>>>>>> >>>>>>>>> Prezados meus números estão aparecendo dessa forma: >>>>>>>>> 3.31000e+12 >>>>>>>>> Como faço para que fique >>>>>>>>> 3310008457687 >>>>>>>>> Alguém pode me ajudar, por favor? >>>>>>>>> Obrigada >>>>>>>>> >>>>>>>>> _______________________________________________ >>>>>>>>> R-br mailing list >>>>>>>>> [email protected] >>>>>>>>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br >>>>>>>>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e >>>>>>>>> forneça código mínimo reproduzível. >>>>>>>>> >>>>>>>> >>>>>>>> _______________________________________________ >>>>>>>> R-br mailing list >>>>>>>> [email protected] >>>>>>>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br >>>>>>>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e >>>>>>>> forneça código mínimo reproduzível. >>>>>>>> >>>>>>> >>>>>>> >>>>>>> _______________________________________________ >>>>>>> R-br mailing list >>>>>>> [email protected] >>>>>>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br >>>>>>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e >>>>>>> forneça código mínimo reproduzível. >>>>>>> >>>>>> >>>>>> >>>>>> >>>>>> -- >>>>>> Manoel Galdino >>>>>> https://sites.google.com/site/galdinomcz/ >>>>>> >>>>>> _______________________________________________ >>>>>> R-br mailing list >>>>>> [email protected] >>>>>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br >>>>>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça >>>>>> código mínimo reproduzível. >>>>>> >>>>> >>>>> >>>>> _______________________________________________ >>>>> R-br mailing list >>>>> [email protected] >>>>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br >>>>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça >>>>> código mínimo reproduzível. >>>>> >>>> >>>> >>>> >>>> -- >>>> \begin{signature} >>>> Daniel Marcelino >>>> ☁ [email protected] >>>> ☎ (514) 343 6111 #3799 >>>> Skype: d.marcelino >>>> ✎ 3200 Jean Brillant, Office C5071 >>>> Montreal, QC; H3T 1N8 >>>> Canada >>>> \end{signature} >>>> >>>> "Small steps toward a much better world" >>>> >>>> _______________________________________________ >>>> R-br mailing list >>>> [email protected] >>>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br >>>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça >>>> código mínimo reproduzível. >>>> >>> >>> >>> _______________________________________________ >>> R-br mailing list >>> [email protected] >>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br >>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça >>> código mínimo reproduzível. >>> >> >> >> >> -- >> Manoel Galdino >> https://sites.google.com/site/galdinomcz/ >> >> _______________________________________________ >> R-br mailing list >> [email protected] >> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br >> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça >> código mínimo reproduzível. >> > > > > -- > \begin{signature} > Daniel Marcelino > ☁ [email protected] > ☎ (514) 343 6111 #3799 > Skype: d.marcelino > ✎ 3200 Jean Brillant, Office C5071 > Montreal, QC; H3T 1N8 > Canada > \end{signature} > > "Small steps toward a much better world" > > _______________________________________________ > R-br mailing list > [email protected] > https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br > Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça > código mínimo reproduzível. >
_______________________________________________ R-br mailing list [email protected] https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
