13 34129

求教飞掠模式

henry2144 于 2019-4-12 16:20 发表 [复制链接]
购买了旗舰版。飞掠模式不成功啊,只给点击一次。
举报 使用道具
| 回复

共 13 个关于本帖的回复 最后回复于 2019-4-15 10:57

henry2144 中级会员 发表于 2019-4-12 16:23:21 | 显示全部楼层
http://std.sacinfo.org.cn/gnoc/q ... 7CECC4F20A517AFABE7
这个弹窗是不是用飞掠模式?
举报 使用道具
wangyong 版主 发表于 2019-4-12 16:26:04 | 显示全部楼层
henry2144 发表于 2019-4-12 16:23
http://std.sacinfo.org.cn/gnoc/queryInfo?id=A6047B87533CE7CECC4F20A517AFABE7
这个弹窗是不是用飞掠模 ...

不点阅读全文的话,不需要用飞掠模式
只点一次的原因是xpath写的不正确,可以把规则名发出来,看看是什么问题
举报 使用道具
Fuller 管理员 发表于 2019-4-12 16:26:49 | 显示全部楼层
henry2144 发表于 2019-4-12 16:23
http://std.sacinfo.org.cn/gnoc/queryInfo?id=A6047B87533CE7CECC4F20A517AFABE7
这个弹窗是不是用飞掠模 ...

痰喘20190412162432.png

这个不是弹窗,这是一个浮动窗体,而弹窗口是指一个完整的有标题条的窗口。点击不到其他的,可能原因:
1,要把当前显示出来的浮窗先关了,不然阻挡了下面的点击位置
2,写的xpath不对,点击用的xpath能覆盖到所有这些点击位置。

你的规则的主题名是什么?
举报 使用道具
Fuller 管理员 发表于 2019-4-12 16:28:01 | 显示全部楼层
我试了一下,点击 阅读全文,就要用飞掠了
举报 使用道具
henry2144 中级会员 发表于 2019-4-12 16:28:44 | 显示全部楼层
主题名是“国家标准公告信息抓取”
举报 使用道具
Fuller 管理员 发表于 2019-4-12 17:11:47 | 显示全部楼层
henry2144 发表于 2019-4-12 16:28
主题名是“国家标准公告信息抓取”

飞掠20190412171018.png
这一级不要勾 飞掠模式

你的点击定位xpath是
  1. //*[@id='gblist']/table[position()=1]/tbody/tr[position()=1]/td[position()=3]/a
复制代码
用如图的方法去搜,只能搜到一条。而是应该改成
  1. //*[@id='gblist']/table[position()=1]/tbody/tr/td[position()=3]/a
复制代码
就能搜到21条了。就是把那个tr的限定删了
举报 使用道具
henry2144 中级会员 发表于 2019-4-15 09:39:24 | 显示全部楼层
谢谢。可以连续点击多条了,但是现在又出现了新的问题就是,遇到文字较多,变成两行文字或多行文字的单元格就跳过不点击了。这个该怎么办?
举报 使用道具
henry2144 中级会员 发表于 2019-4-15 09:40:13 | 显示全部楼层
比如楼上图的第4行第5行。
举报 使用道具
henry2144 中级会员 发表于 2019-4-15 09:53:18 | 显示全部楼层
还有的问题就是对于每一个线索,它在网页里每次点击这些单元格的链接后形成的每个XML文件都重复上上次点击形成的XML文件中的记录,这个怎么改成,每次点击的XML文件只包含本次点击采集的信息。
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-29 03:44