Hi, all

看过架构, (千万级别) 小规模的抓取, 并且处理不复杂的话, 应该不错。

不过 AnyEvent:HTTP 也是个不错的模块, 在上面做做, 也很容易做到那个架构。

http://www.biaodianfu.com/scrapy-architecture.html


2011/9/5 Beckheng Lam <[email protected]>

> 底层的基本上都处理好了,关心要抓取的内容就行。
>
> 当然我也只是测试了一下,但第一感觉就是棒!
>
> --
> 我的博客 -- http://blog.yixinit.com/
> 诸法从缘起,如来说是因。
> 彼法因缘尽,是大沙门说。
>
> --
> 您收到此邮件是因为您订阅了 Google 网上论坛的“PerlChina Mongers 讨论组”论坛。
> 要向此网上论坛发帖,请发送电子邮件至 [email protected]。
> 要取消订阅此网上论坛,请发送电子邮件至 
> perlchina+unsubscribe@**googlegroups.com<perlchina%[email protected]>
> 。
> 若有更多问题,请通过 
> http://groups.google.com/**group/perlchina?hl=zh-CN<http://groups.google.com/group/perlchina?hl=zh-CN>访问此网上论坛。
>
>

-- 
您收到此邮件是因为您订阅了 Google 网上论坛的“PerlChina Mongers 讨论组”论坛。
要向此网上论坛发帖,请发送电子邮件至 [email protected]。
要取消订阅此网上论坛,请发送电子邮件至 [email protected]。
若有更多问题,请通过 http://groups.google.com/group/perlchina?hl=zh-CN 访问此网上论坛。

回复