怎样把不同目錄的资料一次过提取?

比如MetaSeeker操作入门练习里的贵州菜下,如果还分了a、b、c等十多个地区,应该如何有效率地把各地区的资料提取(在利用纵向爬行、翻页提取的情況下)? 请高手指点,谢谢!

看了你结的例,也试

看了你结的例,也试过分析它的结构,但是和我遇到的问题好像不太一样,比如在joyo"文学"下有

* 中国文学
* 散文随笔
* 诗歌词曲
* 纪实文学
* 影视文学
* 民间文学
* 作品集
* 名家作品及研究
* 文学史
* 文学评论与研究
* 文学理论
* 期刊杂志
* 所有文学图书

当我在"文学"的版面下,若要提取每一个"文学"的细分目录的书名,应该要第一次纵向爬行吧? 在细分目录的每一本书中,要提取比如"商品描述"应该再需要多一次纵向爬行,具体应该怎样操作才能把这5万7千多本书的内容按joyo的分类提取呢?我想了几小时也想不到,希望高手继续回答

需要一个样本页面

给个具体的网页的例子,可以讨论一下数据抓取规划

比如以卓越的文学书

比如以卓越的文学书为例,下面从文学理论到文学作品导读,有13个分类,每个分类有数百至上千个项目,要是把"文学"下所有书本的资料实现纵向爬行提取,应该是怎样操作?
网址:
http://www.amazon.cn/s/ref=nb_sb_noss?__mk_zh_CN=%E4%BA%9A%E9%A9%AC%E9%8...

通过翻页从网页上抓取信息

可以参看hibuzz_weibo_qq_list这个信息结构,会翻很多页,每页上面好多微博。为了加载这个信息结构,需要先在Firefox中登录QQ微博,否则加载不成功

我先试一下,谢谢你!!

我先试一下,谢谢你!!

加载并测试了卓越图书抓取主题

抓取是正常的,你在哪里看到是ready状态?ready应该是正确的,表示定义成功了。

你好,谢谢你的回答

你好,谢谢你的回答,我后来测试了,原来我用了有信息属性的主题作为目标主题是不行的,现在试好了