怎样把不同目錄的资料一次过提取?

Fri, 11/19/2010 - 22:02 — bbchi

比如MetaSeeker操作入门练习里的贵州菜下，如果还分了a、b、c等十多个地区，应该如何有效率地把各地区的资料提取(在利用纵向爬行、翻页提取的情況下)？请高手指点，谢谢!

MetaSeeker工具包

Sat, 11/20/2010 - 19:27 — bbchi

看了你结的例，也试

看了你结的例，也试过分析它的结构，但是和我遇到的问题好像不太一样，比如在joyo"文学"下有

* 中国文学
* 散文随笔
* 诗歌词曲
* 纪实文学
* 影视文学
* 民间文学
* 作品集
* 名家作品及研究
* 文学史
* 文学评论与研究
* 文学理论
* 期刊杂志
* 所有文学图书

当我在"文学"的版面下，若要提取每一个"文学"的细分目录的书名，应该要第一次纵向爬行吧？在细分目录的每一本书中，要提取比如"商品描述"应该再需要多一次纵向爬行，具体应该怎样操作才能把这5万7千多本书的内容按joyo的分类提取呢？我想了几小时也想不到，希望高手继续回答

Fri, 11/19/2010 - 23:35 — Fuller

需要一个样本页面

给个具体的网页的例子，可以讨论一下数据抓取规划

Fri, 11/19/2010 - 23:44 — bbchi

比如以卓越的文学书

比如以卓越的文学书为例，下面从文学理论到文学作品导读，有13个分类，每个分类有数百至上千个项目，要是把"文学"下所有书本的资料实现纵向爬行提取，应该是怎样操作？
网址:
http://www.amazon.cn/s/ref=nb_sb_noss?__mk_zh_CN=%E4%BA%9A%E9%A9%AC%E9%8...

Fri, 11/19/2010 - 23:55 — Fuller