感谢制作者,为我们提供软件的免费使用。软件的确很好,功能很强大,能够抓取大部分的网站。最近玩这个软件上瘾了,同时也遇到很多问题。
实例1:
http://stores.ebay.com/Adorama-Camera/Computer-Systems-/_i.html?_fsub=84...
每行3个产品,属于1个组(每行为一组,每页有多组)。 复制抓取规则后只能抓取一个组内的3个产品。设置多级容点节器,分别对应小组和产品。对小组和样品规则分别激活复制样例。抓取失败。
实例2:
http://www.microsoftstore.com/store/msusa/en_US/list/All-in-ones-+-deskt...
和上个网页类似,分为多层结构。
每行为4个产品,其中第一个产品和其他3个产品的结构性质不同。设置多级容点节器,分别抓取每行1一个和其他3个。一直未能成功。
主题名是什么?
我可以检查一下信息结构定义的问题
另外一个主题名是
另外一个主题名是 ebay1
这个样本页面上没有商品
请选择一个商品比较丰富的网页做样本页面
主题是M1,提示“Duplic
主题是M1,提示“Duplication happens in wrong position”无法上传。
我将样品管理去激活以后上传为M1,你可以将其重新激活。就能看到我最初制作的抓取规则了。
样例复制品映射要用相同级别的节点
参看《采集当当网价格》,在第四步,做样例复制品映射的时候一定要选择位于DOM相同级别的兄弟节点。