Para ler o arquivo, você poderia em princípio usar a função read.fwf. Mas essa função não é otimizada para dados grandes, então você vai preferir alguma alternativa. Uma opção é importar com o comando laf.open do pacote LaF, e outra é transformar de largura fixa para csv com o comando fwf2csv do pacote descr, e então importar com o comando read.table do pacote data.table. Atualmente minha opção favorita é esta última. Procurando nesta lista de discussão e no stack overflow você encontra orientações detalhadas.
-- Leonardo Ferreira Fontenelle http://lattes.cnpq.br/9234772336296638 Em Ter 24 mar. 2015, às 09:52, Luciane Maria Pilotto escreveu: > Bom dia, > > estou tentando ler as variáveis da PNAD de 2003 - V1701 a V1377- > relacionadas ao suplemento Saúde- e as mesmas aparecem como NA. O banco > está disponível no site do IBGE > http://www.ibge.gov.br/home/estatistica/populacao/trabalhoerendimento/pnad2013/microdados.shtm. > > Também podem ser acessados no dropbox: > https://www.dropbox.com/sh/d0z62bg4qqyg2x3/AAAVDYWjVlb4JpUTYlQfvq-Ka?dl=0. > > Estou usando os comandos abaixo: > > #----------------Ler microdados da PNAD 2003 (variáveis referente ao > suplemento Saúde) utilizando a função read.fwf.r ----------------------# > > source(file.choose()) #carregar a função selectvar da pasta funcoes > source(file.choose()) #carregar a função getdic da pasta funcoes > > # Gerar os dicionários de dados a partir dos arquivos: 'input > PES2003.txt' > dicPNAD2003Pes <- getdic(file.choose())# abrir o arquivo input > PES2003.txt, dentro da Pasta Input > > head(dicPNAD2003Pes) > str(dicPNAD2003Pes) > nrow(dicPNAD2003Pes) > dim(dicPNAD2003Pes) > > # Para EXCLUSÃO do "UF" (que apresenta erro na importação por começar na > mesma posição que número de controle): > > dicPNAD2003Pes <- subset(dicPNAD2003Pes, cod !="UF") > head(dicPNAD2003Pes) > dim(dicPNAD2003Pes) > > ####Usar estes comandos para importar *apenas algumas variáveis* da base > de dados das PESSOAS > > variaveis <- selectvar(dicPNAD2003Pes) # Com a tecla CTRL pressionada, > selecione as variáveis de interesse, neste caso são as que aparecem como > NA: > Erro em substring(x, first, last) : invalid substring arguments > > ### PROBLEMA: Ao abrir a janela das variáveis utilizando o comando acima, > as variáveis de interesse referentes a saúde aparecem como NA, > diferentemente das demais variáveis que aparecem no banco. No dicionário > as mesmas aparecerem corretamente. > > Atenciosamente, > > __________________________________________________ > Luciane Maria Pilotto > > > _______________________________________________ > R-br mailing list > [email protected] > https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br > Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça > código mínimo reproduzível. _______________________________________________ R-br mailing list [email protected] https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
