8 12823

采集不完整,求解!

suixinguniang 于 2017-12-25 17:47 发表 [复制链接]
规则名:宝格丽项链D
线索/网址:https://www.bulgari.com/zh-cn/products.html?aesthetic_line=55&root_level=315&product_detail_one=218&rid=2

举报 使用道具
| 回复

共 8 个关于本帖的回复 最后回复于 2017-12-27 14:09

wangyong 版主 发表于 2017-12-25 18:08:46 | 显示全部楼层
QQ截图20171225180623.png
按照这个教程做上翻页线索:《用@class属性做翻页记号》
举报 使用道具
数据集二期 中级会员 发表于 2017-12-25 18:12:20 | 显示全部楼层
有部分数据要点击“了解更多”才能显示出来,如果不显示出来的话直接做样例复制是采集不到的。
1,可以做一个翻页线索来点击“了解更多”,采集全部的数据,操作和做翻页是一样的。参考《翻页》
2,可以新建一个连续动作来点击“了解更多”来展示全部内容再采集,《连续动作》
建议使用第一种方法。

举报 使用道具
Fuller 管理员 发表于 2017-12-25 18:15:00 | 显示全部楼层
我看就是一个图没有采集到,其他内容采集都是全的。因为被选中的那个图的class='grid-cell active',而其他的都是class='grid-cell',在生成采集规则的时候会自动选择一个class或者id,为了避免这个问题,在“创建规则”工作台的右边有个“定位”按钮,选择决定定位,就能避免这个class
举报 使用道具
suixinguniang 初级会员 发表于 2017-12-26 10:32:17 | 显示全部楼层
wangyong 发表于 2017-12-25 18:08
按照这个教程做上翻页线索:《用@class属性做翻页记号》

好像还是不行,怎么回事啊
举报 使用道具
数据集二期 中级会员 发表于 2017-12-26 11:03:43 | 显示全部楼层
本帖最后由 数据集二期 于 2017-12-26 11:10 编辑
suixinguniang 发表于 2017-12-26 10:32
好像还是不行,怎么回事啊

哪里有问题,你的规则都没有修改,连续动作或者记号线索都没有做,肯定是不行的,如图所示做记号线索,是可以采集的
3.jpg
举报 使用道具
wangyong 版主 发表于 2017-12-26 11:09:01 | 显示全部楼层
suixinguniang 发表于 2017-12-26 10:32
好像还是不行,怎么回事啊

你的规则里还没加上翻页线索
举报 使用道具
suixinguniang 初级会员 发表于 2017-12-27 13:57:27 | 显示全部楼层
数据集二期 发表于 2017-12-26 11:03
哪里有问题,你的规则都没有修改,连续动作或者记号线索都没有做,肯定是不行的,如图所示做记号线索,是 ...

网址:https://www.bulgari.com/zh-cn/products.html?root_level=315&product_detail_one=218&rid=2
像这样的网页结构呢?有多处“了解更多”,怎样设置规则?

举报 使用道具
bowieD 金牌会员 发表于 2017-12-27 14:09:08 | 显示全部楼层
suixinguniang 发表于 2017-12-27 13:57
网址:https://www.bulgari.com/zh-cn/products.html?root_level=315&product_detail_one=218&rid=2
像这 ...

翻页不行的话,就查看第二种方法,用连续动作来点击
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-29 14:12