13 34251

求教飞掠模式

henry2144 于 2019-4-12 16:20 发表 [复制链接]
henry2144 中级会员 发表于 2019-4-15 10:16:25 | 显示全部楼层
点击后增加延时?重复采集的原因是没有点击关闭小窗?但是点击关闭小窗后的主题填什么?
举报 使用道具
Fuller 管理员 发表于 2019-4-15 10:30:59 | 显示全部楼层
henry2144 发表于 2019-4-15 09:39
谢谢。可以连续点击多条了,但是现在又出现了新的问题就是,遇到文字较多,变成两行文字或多行文字的单元格 ...

那一行信息的第二行内容,只有前面一点,后面是空白,所以,点那一行中心点的话很容易点不到链接。

在高级设置中,有个精确点击,可以设置点击位置,就是在那个html节点范围内,可以精确控制点击点所在位置的宽高比例,如图,高度的20%,宽度的20%,是从左上角开始算起的,这个比例可能可以点到,如果还不行,把宽度的比例进一步调小,比如 2%
精确点击20190415102059.png
举报 使用道具
Fuller 管理员 发表于 2019-4-15 10:32:41 | 显示全部楼层
henry2144 发表于 2019-4-15 09:53
还有的问题就是对于每一个线索,它在网页里每次点击这些单元格的链接后形成的每个XML文件都重复上上次点击 ...

每做一轮动作,就要采集一次数据,如果采集的目标数据是点击前的内容,或者点击后包括上一轮点击出来的内容,那么一定会重复采集下来。只能在导出了结果文件以后,在excel中进行过滤
举报 使用道具
henry2144 中级会员 发表于 2019-4-15 10:57:12 | 显示全部楼层
明白了,谢谢!
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-19 07:57