列表单页的信息以及翻页的基本信息都基本会抓取了
想问问根据ID 到详细的页面的里面的信息怎么抓取呢 ?! 希望提供一个思路。 谢谢!
是不是要做层级抓取?
我可能 没有描述清楚 ,
list.asp 列表页面, 能抓取商品的基础信息, 比如 小图地址 商品名字 单价 商品ID, 但商品的具体的介绍 是在DISPLAY.ASP?id=566 这样的页面显示。
我想请教的是 如何 根据list.asp页面上 ID 抓取 不同的商品具体介绍呢?
企业版的数据库是开放的,可以根据list抓到的id号自动构造出url地址,生成抓取线索。这个自动生成过程在配套的入库软件MetaCorpora中实现。
在线版用户不能构造url,但是可以在list.asp网页上抓取到display.asp?id=xxx这样的网址,采用层级抓取方法,为下一级生成线索。
恩 这个思路能理解到, 本站的文档里 有介绍关于层级抓取的方法吗?! 好像只看到 在同一个页面上抓取等介绍。 没有看到层级的抓取。麻烦能否丢一个连接看看呢?
层级抓取方法参看《层级抓取》
这个抓取问题没有看懂
是不是要做层级抓取?
我可能 没有描述清楚
我可能 没有描述清楚 ,
list.asp 列表页面, 能抓取商品的基础信息, 比如 小图地址 商品名字 单价 商品ID, 但商品的具体的介绍 是在DISPLAY.ASP?id=566 这样的页面显示。
我想请教的是 如何 根据list.asp页面上 ID 抓取 不同的商品具体介绍呢?
企业版可以用程序生成线索
企业版的数据库是开放的,可以根据list抓到的id号自动构造出url地址,生成抓取线索。这个自动生成过程在配套的入库软件MetaCorpora中实现。
在线版用户不能构造url,但是可以在list.asp网页上抓取到display.asp?id=xxx这样的网址,采用层级抓取方法,为下一级生成线索。
在线版用户不能构造ur
在线版用户不能构造url,但是可以在list.asp网页上抓取到display.asp?id=xxx这样的网址,采用层级抓取方法,为下一级生成线索。
恩 这个思路能理解到, 本站的文档里 有介绍关于层级抓取的方法吗?! 好像只看到 在同一个页面上抓取等介绍。 没有看到层级的抓取。麻烦能否丢一个连接看看呢?
层级抓取
层级抓取方法参看《层级抓取》