请问,在爬虫路线中用的模拟点击和连续动作中的点击有什么区别?
举报 使用道具
| 回复

共 3 个关于本帖的回复 最后回复于 2016-9-21 10:03

Fuller 管理员 发表于 2016-9-21 09:59:56 | 显示全部楼层
爬虫路线中,模拟点击要求勾上“连贯抓取”,在一个抓取线程里面,连贯抓取只能顺着一条线,也就是说每次只能点击一次,就进行抓取。

而连续动作中,可以定义一组动作,比如,含有8个动作,每做一轮,这8个都做一遍,然后才抓取,抓取完成后又做下一轮,再抓取。
从第一轮到第二轮,就是计数器进位一样。如果一轮8个动作,相当于8个位的计数器,那么下一轮的时候,先从最右边那位加1,加满的话,就向左进位

举报 使用道具
何波波 金牌会员 发表于 2016-9-21 10:03:19 | 显示全部楼层
1、爬虫路线中的点击通常是指做翻页、模拟点击;但是一个规则的爬虫路线只能设置一个点击。
2、连续动作中却可以定义多个动作,包括点击,悬浮,输入,提交等动作;一个规则可以设置多个点击或者点击、输入、提交等组合的动作。
举报 使用道具
Fuller 管理员 发表于 2016-9-21 10:03:52 | 显示全部楼层
假设一共8位,每一位有10个值,相当于10进制,那么他们可以组合出 10 X 10 X 10 X 10 X 10 X 10 X 10 X 10  轮动作,比如,抓取保险信息,保障项选择有很多,抓一个保险的保费数据可能需要做几百万轮动作,能抓到几百万个结果文件
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-29 14:11