本帖最后由 niniliya 于 2018-8-29 13:29 编辑

连续动作(模拟点击)一层可以全部点开,二层点开后采集不到数据,错误分析找不到映射,重新内容映射,定位映射后,再运行一层去爬数据,还是采不到,而且之前的映射被清空。
线索网址:需要登录。https://www.wanshare.com/member/merchant/sell
规则名称一级主题:模拟点击加号
二级主题:第二步点开加号后采集

这是已经映射的截图。
QQ图片20180829125938.png

这是爬数据后二层出错的提示

微信图片_20180829132414.png


举报 使用道具
| 回复

共 5 个关于本帖的回复 最后回复于 2018-8-30 13:13

Fuller 管理员 发表于 2018-8-29 16:50:34 | 显示全部楼层
首先,要确认第一级做了动作以后,有没有动作的效果,有没有看到点击后的内容?如果已经看到内容了,说明动作没有问题。

第二级抓取内容中只能包含包含动作后显示出来的内容,不要包含第一级的内容,混在一起抓不了。如果第二级规则匹配不了,尝试给他们做上定位标志映射。

加载分析第二级规则的时候,要注意顺序:
1,加载网页
2,按照第一级定义的动作顺序,手工执行动作
3,进入到集搜客浏览器的定义规则模式
4,在搜规则工作台上,搜到第二级规则,选择菜单 “加载(仅规则)”,不能用普通的 “加载”,MS谋数台上没有“加载(仅规则)”,只能用爬虫浏览器
举报 使用道具
niniliya 初级会员 发表于 2018-8-29 18:36:08 | 显示全部楼层
一级,点开了一个
举报 使用道具
niniliya 初级会员 发表于 2018-8-29 18:38:22 | 显示全部楼层
Fuller 发表于 2018-8-29 16:50
首先,要确认第一级做了动作以后,有没有动作的效果,有没有看到点击后的内容?如果已经看到内容了,说明动 ...

一级在DS看到点开了一个,在生成的数据里显示 都打开了
微信截图_20180829183724.png

微信图片_20180829132414.png
举报 使用道具
Fuller 管理员 发表于 2018-8-29 20:01:49 | 显示全部楼层
niniliya 发表于 2018-8-29 18:38
一级在DS看到点开了一个,在生成的数据里显示 都打开了

你把第二级规则加载以后重新映射一下,并且用上定位标志映射,参看:https://www.gooseeker.com/doc/article-344-1.html
这样能提高定位精度

另外,加载第二级规则的时候,要像我前面说的,先把内容点出来,然后加载分析规则
举报 使用道具
niniliya 初级会员 发表于 2018-8-30 13:13:49 | 显示全部楼层
Fuller 发表于 2018-8-29 20:01
你把第二级规则加载以后重新映射一下,并且用上定位标志映射,参看:https://www.gooseeker.com/doc/arti ...

之前就是用的内容映射和定位映射

举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-19 05:26