本帖最后由 goGooSeeker 于 2016-9-5 19:58 编辑

我采集的信息在第1屏-第10屏之间,
但是页面总共有上百屏,
每次采集都要浪费时间滚到底。

我看了连续动作里面的滚屏好像是设置滚屏完再滚屏的次数的,
我这种情况有办法设置解决吗?比如说只滚前10屏
举报 使用道具
| 回复

共 8 个关于本帖的回复 最后回复于 2016-9-5 19:57

沙发
Fuller 管理员 发表于 2016-9-5 15:26:34 | 只看该作者
连续动作能控制具体的滚屏次数,连续动作的滚屏会产生很多结果文件,滚一次产生一个结果文件
举报 使用道具
板凳
goGooSeeker 初级会员 发表于 2016-9-5 16:21:09 | 只看该作者
Fuller 发表于 2016-9-5 15:26
连续动作能控制具体的滚屏次数,连续动作的滚屏会产生很多结果文件,滚一次产生一个结果文件 ...

嗯嗯,这个我已经清楚了,我如上描述的问题有办法设置解决吗?就是只采集第1-10屏的内容,剩下的屏就不要滚了,直接跳过采集下条,不然太浪费时间了
举报 使用道具
地板
Fuller 管理员 发表于 2016-9-5 16:37:02 | 只看该作者
goGooSeeker 发表于 2016-9-5 16:21
嗯嗯,这个我已经清楚了,我如上描述的问题有办法设置解决吗?就是只采集第1-10屏的内容,剩下的屏就不要 ...

连续动作中的滚屏可以设置次数的,就设置10
举报 使用道具
5#
goGooSeeker 初级会员 发表于 2016-9-5 16:58:55 | 只看该作者
Fuller 发表于 2016-9-5 16:37
连续动作中的滚屏可以设置次数的,就设置10

我在   工作台 -> 连续动作 -> 滚屏  里面设置
不论是
每次滚屏数10,总共滚屏数1
还是
每次滚屏数1,总共滚屏数10
都会在采集网页的时候滚到底
举报 使用道具
6#
Fuller 管理员 发表于 2016-9-5 17:07:07 | 只看该作者
goGooSeeker 发表于 2016-9-5 16:58
我在   工作台 -> 连续动作 -> 滚屏  里面设置
不论是
还是

应该用后者

检查一下DS打数机的菜单 配置-》滚屏参数,在这里滚屏次数要设置成0,看看是否有效果。
举报 使用道具
7#
goGooSeeker 初级会员 发表于 2016-9-5 17:37:13 | 只看该作者
本帖最后由 goGooSeeker 于 2016-9-5 17:39 编辑
Fuller 发表于 2016-9-5 17:07
应该用后者

检查一下DS打数机的菜单 配置-》滚屏参数,在这里滚屏次数要设置成0,看看是否有效果。

经过测试,滚屏10次是如下参数:
工作台 -> 连续动作:
每次滚屏数10,总共滚屏数1
DS打数机 -> 滚屏参数
滚屏次数0
滚屏速度2

但是有个问题, 每次会自动生成2个采集文件,原本是生成1个的。
我在其他参数不变的情况下把总共滚屏数改为-1,就会无限采集生成当前页面
改为0还是每次自动生成2个采集文件,2个采集文件是重复相同的
举报 使用道具
8#
ym 版主 发表于 2016-9-5 18:19:27 | 只看该作者
goGooSeeker 发表于 2016-9-5 17:37
经过测试,滚屏10次是如下参数:

但是有个问题, 每次会自动生成2个采集文件,原本是生成1个的。

滚屏一次就增加生成一个xml文件,可以导入到excel中过滤重复内容
举报 使用道具
9#
goGooSeeker 初级会员 发表于 2016-9-5 19:57:59 | 只看该作者
ym 发表于 2016-9-5 18:19
滚屏一次就增加生成一个xml文件,可以导入到excel中过滤重复内容

ok,已解决,感谢
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 话题分析(NMF模型和LDA模型)软件的安装和
  • 运行Apple无法验证的程序的方法
  • 文本聚类分析软件的安装和使用方法
  • 利用AI阅读和分析文本:扣子COZE记录用户反
  • 在网页片段内直观标注——以B站评论采集为

热门用户

GMT+8, 2025-2-6 22:56