爬虫路线和连续动作有什么区别
举报 使用道具
| 回复

共 2 个关于本帖的回复 最后回复于 2016-10-18 09:25

沙发
ym 版主 发表于 2016-5-24 15:20:50 | 只看该作者
本帖最后由 ym 于 2016-12-12 15:29 编辑

这两个设置的目的都是模拟鼠标动作,所以,一个规则中只能选择其中一种来设置,而不是两种都用,否则,爬虫就会不执行而跳过。

爬虫路线
在下面两种情况用到:
1)设置下级线索:把抓到的网址导入到下级规则中。
具体操作:在整理箱中抓网址,勾上下级线索后,去爬虫路线中填目标主题名。

2)点击:通常是翻页、模拟点击,两者原理及操作是一样,但一个规则的爬虫路线只能设置一个点击。
例如:我要抓天猫评论,需要做成两级规则,第一级规则整理箱抓商品信息并在爬虫路线中设置记号线索,模拟点击”累计评价“,第二级规则整理箱抓评论并在爬虫路线中设置记号线索,点击下一页进行翻页。
如果是只要抓追评的话,就要做成三级规则,第一级规则模拟点击”累计评价“,第二级规则模拟点击“ 追评 ”,第三级规则才是抓追评的评论数据,并且设置翻页。

连续动作是支持连续多个动作,包括点击、悬浮、输入、滚屏、提交、选择等动作。
同一个规则可以设置多个点击或者是点击+输入+提交等组合的动作。例子参看http://www.gooseeker.com/doc/article-261-1.html
连续动作教程http://www.gooseeker.com/doc/article-141-1.html
举报 使用道具
板凳
Fuller 管理员 发表于 2016-10-18 09:25:06 | 只看该作者
当需要选择“爬虫路线”还是“连续动作”的时候,请参看这个帖子:http://www.gooseeker.com/doc/thread-3716-1-1.html

原则是:首选层级抓取,不行的话才用连续动作
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-20 16:04