Vinicius,
A função subset é bem flexível e permite elevado nível de customização.
Geralmente uso ela para crítica dos dados, antecedendo análises.
Não seria interessante para você?
Por exemplo:
# gerando um data.frame com outliers
Idade <- c(NA, -10, rnorm(1e2, m=30, sd=2), 150)
Tempo <- c(rnorm(1e2, m=10, sd=1), NA, -50, 1e3)
dad <- data.frame(Idade, Tempo)
str(dad)
# verificar outliers
boxplot(dad, range=2.5)
# remoção de todas as linhas contendo NA
dadf <- na.omit(dad)
# remoção das linhas de forma mais criteriosa
dadf <- subset(dadf,
Idade < 2.5*(median(dadf[, 1])) &
Idade > 0 &
Tempo < 2.5*(median(dadf[, 2])) &
Tempo > 0)
str(dadf)
boxplot(dadf, range=2.5) # verificar remoção de outiliers
Usei 2.5*mediana apenas por simpicidade didática.
Você poderia usar um critério mais consistente, por exemplo, um
múltiplo (1.5 a 2.5) da distância interquartílica.
Veja com calcular os quatis no R coma função quantile:
> ?quantile
Abs,
--
///\\\///\\\///\\\///\\\///\\\///\\\///\\\///\\\
Jose Claudio Faria
Estatistica - Prof. Pleno
UESC/DCET/Brasil
joseclaudio.faria at gmail.com
///\\\///\\\///\\\///\\\///\\\///\\\///\\\///\\\
Em 25 de julho de 2011 10:45, Vinicius Brito Rocha
<[email protected]> escreveu:
> Srs,
>
> tenho uma data.frame onde preciso realizar um filtro do mesmo, a partir de
> uma das variáveis categóricas. Porém tenho uma lista de restrições dessa
> variável à filtrar.
> Escrever uma a uma cada restrição dará muito trabalho.
>
> Alguém sabe como posso fazer isso de forma mais inteligente?
>
> Abs
>
> --
> Vinicius Brito Rocha.
> Estatístico e Atuário,
> Mestre em Pesquisa Operacional
>
> www.aplicademic.blogspot.com
> http://twitter.com/viniciusbritor
>
> "Não se preocupe muito com as suas dificuldades em Matemática, posso
> assegurar-lhe que as minhas são ainda maiores." - Albert Einstein.
>
>
>
> _______________________________________________
> R-br mailing list
> [email protected]
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código
> mínimo reproduzível.
_______________________________________________
R-br mailing list
[email protected]
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código
mínimo reproduzível.