Você pode pegar dados do ipeadata (http://www.ipeadata.gov.br/) que são
socioeconômicos. Outras fontes de dados são de esportes como a maratona de
Paris (http://www.20kmparis.com/web/resultats_precedents.asp) e triathlon (
http://www.ipitos.com/accueil/). As de esportes são interessantes para
explorar manuseio de datas (tempo de prova), agrupamento em classe de idade
dos atetlas, relações entre tempo de prova, idade, sexo. As de triathlon
são interessantes para fazer visualizações multivariadas (nadar, correr,
pedalar) e condicionais (à idade, ao sexo) com, por exemplo, a lattice.
Além disso, você pode pegar dados para fazer mapas do site do ibge. Eu
prefiro fazer análise com esses dados maiores (n>10000) porque acredito que
reflitam mais a realidade dos conjuntos de dados do hoje em dia (grande
dimensão).

À disposição.
Walmes.

_______________________________________________
R-br mailing list
[email protected]
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código 
mínimo reproduzível.

Responder a