规则:小刚的京东商品_自动点击
没法全部爬下来

举报 使用道具
| 回复

共 7 个关于本帖的回复 最后回复于 2018-10-13 08:52

沙发
Fuller 管理员 发表于 2018-10-11 18:40:17 | 只看该作者
你这个规则加载失败,在“创建规则”工作台上,要采集的3个抓取内容分别是什么?一个都加载不了。最好用上定位标志映射

你定义的点击表达式是 //*[@id='choose-attr-1'] ,这点不到一个具体颜色的。定义好xpath以后,应该先搜索一下,看看能否搜索到每个颜色,你这个xpath能搜到那一整块,但是不是每个颜色

举报 使用道具
板凳
Fuller 管理员 发表于 2018-10-11 18:43:05 | 只看该作者
改成这个xpath,就能搜索到4个颜色了://*[@id='choose-attr-1']//div[contains(@class, 'item')]/a


举报 使用道具
地板
xiaogang114 初级会员 发表于 2018-10-12 19:31:04 | 只看该作者
修改了还是爬不出来
举报 使用道具
5#
xiaogang114 初级会员 发表于 2018-10-12 19:32:10 | 只看该作者
修改了还是爬不出,规则名已改为:小刚的京东商品-走动点击
举报 使用道具
6#
Fuller 管理员 发表于 2018-10-12 20:19:14 | 只看该作者
我看到你定义了好几个规则,有 小刚的京东商品-自动点击  和 小刚的京东商品_自动点击 两个,我加载分析了第一个,我发现连续动作的目标主题名是  小刚的京东商品-自动点击2,但是这个规则并没有定义。这样就执行不了了

目标主题名可以保持不变

另外,点击套餐那一步,点击以后,套餐内容会把增值保障和京东服务都给挡住了,所以,后面的这两步就点不了了。

还有,增值保障,京东服务,都是点击以后会出现一个下拉菜单,必须做选择才有效
举报 使用道具
7#
xiaogang114 初级会员 发表于 2018-10-12 21:08:29 | 只看该作者

举报 使用道具
8#
Fuller 管理员 发表于 2018-10-13 08:52:11 | 只看该作者
如果连续三次抓到的内容是一样的,就中断了。

如果不想中断,选择DS打数机菜单 配置-》终点标志-》重复内容,不要勾选
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-27 01:28