按着ID 的序列抓取每个相同结构页面 里面的 信息 应该 怎么操作呢?

列表单页的信息以及翻页的基本信息都基本会抓取了

想问问根据ID 到详细的页面的里面的信息怎么抓取呢 ?! 希望提供一个思路。 谢谢!

这个抓取问题没有看懂

是不是要做层级抓取?

我可能 没有描述清楚

我可能 没有描述清楚 ,

list.asp 列表页面, 能抓取商品的基础信息, 比如 小图地址 商品名字 单价 商品ID, 但商品的具体的介绍 是在DISPLAY.ASP?id=566 这样的页面显示。

我想请教的是 如何 根据list.asp页面上 ID 抓取 不同的商品具体介绍呢?

企业版可以用程序生成线索

企业版的数据库是开放的,可以根据list抓到的id号自动构造出url地址,生成抓取线索。这个自动生成过程在配套的入库软件MetaCorpora中实现。

在线版用户不能构造url,但是可以在list.asp网页上抓取到display.asp?id=xxx这样的网址,采用层级抓取方法,为下一级生成线索。

在线版用户不能构造ur

在线版用户不能构造url,但是可以在list.asp网页上抓取到display.asp?id=xxx这样的网址,采用层级抓取方法,为下一级生成线索。

恩 这个思路能理解到, 本站的文档里 有介绍关于层级抓取的方法吗?! 好像只看到 在同一个页面上抓取等介绍。 没有看到层级的抓取。麻烦能否丢一个连接看看呢?

层级抓取

层级抓取方法参看《层级抓取》