-----BEGIN PGP SIGNED MESSAGE----- Hash: SHA1 caio ferreira wrote: > All > > Possuo uma série de livros e estou querendo catalogar os mesmo. > > Para fazer o cadastramento estou utilizando o software Tellico. para > fazer > o cadastramento faço a pesquisa pelo número ISBN e adiciono o livro no > sistema. O problema é que a maioria dos livros são em português e o > software consulta a base de Amazon, com isso o software não esta > encontrando a maioria dos livros. Mas se eu for no site da Livraria Cultura > e procurar no sistema de busca[1] e procurar pelo ISBN eu encontro o livro. > O problema é que procurar livro por livro vai demorar muito. Alguém por > acaso saberia me dizer se é possível: > > A-acessar o site de procurar da Livraria Cultura via links2/w3m/lynxs; > B-passar o número ISBN para o browser; > C-obter o resultado; > D-filtrar o dado; > E-gravar em um arquivo; > > Alguém por acaso teria alguma idéia de como eu poderia fazer isso ? > > Desde já obrigado. > > 1-http://www.livrariacultura.com.br/scripts/cultura/catalogo/busca.asp?sid=01718213782550393284353&k5=35CF5805&uid=
Tá facil :) wget "http://www.livrariacultura.com.br/scripts/cultura/catalogo/busca.asp?sid=01718213782550393284353&k5=3603BB3E&uid=&parceiro=IROJOJ&bmodo=&palavratitulo=&modobuscatitulo=pc&palavraautor=&modobuscaautor=pc&palavraeditora=&palavraISBN=12345&n1n2=&cidioma=&precomax=0&ordem=disponibilidade " Veja que o método do form de procura é um método GET simples, ou seja, todas as variáveis de procura são passadas na própria URL. Basta substituir 12345 apos ISBN= pelo ISBN que você quer e pronto. Depois disso, obviamente entra um trabalho seu de análise do código HTML para filtrá-lo. Para limpar as tags HTML do resultado, você pode fazer um sed 's/<[^>]*>//g' arquivo_resultado.html. Daí para frente, é só trabalho de filtar a informação. []'s - -- GPG Public Key http://keyserver.veridis.com:11371/export?id=-6037232142263389818 \\|||// (.) (.) - ----ooOO--( )--OOoo----- MrBiTs http://www.mrbits.com.br [EMAIL PROTECTED] - ------------------------ -----BEGIN PGP SIGNATURE----- Version: GnuPG v1.4.1 (GNU/Linux) Comment: Using GnuPG with Mozilla - http://enigmail.mozdev.org iD8DBQFD+EQ8rDdxWm3R8YYRAqPzAJ4x9gtia5VSyoyx7UZ5aO9hwHwwSwCaAkeS o0RgCMj2FqIBhEPHX0j8v7Q= =5vjc -----END PGP SIGNATURE----- --------------------------------------------------------------------- Esta lista não admite a abordagem de outras liguagens de programação, como perl, C etc. Quem insistir em não seguir esta regra será moderado sem prévio aviso. --------------------------------------------------------------------- Sair da lista: [EMAIL PROTECTED] --------------------------------------------------------------------- Esta lista é moderada de acordo com o previsto em http://www.listas-discussao.cjb.net --------------------------------------------------------------------- Servidor Newsgroup da lista: news.gmane.org Grupo: gmane.org.user-groups.programming.shell.brazil Links do Yahoo! Grupos <*> Para visitar o site do seu grupo na web, acesse: http://br.groups.yahoo.com/group/shell-script/ <*> Para sair deste grupo, envie um e-mail para: [EMAIL PROTECTED] <*> O uso que você faz do Yahoo! Grupos está sujeito aos: http://br.yahoo.com/info/utos.html