任务名:证券从业人员基本信息公示

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报
| 回复

共 4 个关于本帖的回复 最后回复于 2020-8-31 11:47

沙发
Fuller 管理员 发表于 2020-8-31 11:16:07 | 只看该作者
我正在测试你的规则,我看到你的点击xpath是 //*[@id='publicityOtherList']//td[position()=2]
这是点击td元素节点,我估计应该点击td下的a节点  //*[@id='publicityOtherList']//td[position()=2]/a

我试试
举报
板凳
Fuller 管理员 发表于 2020-8-31 11:25:35 | 只看该作者
我测试了你的规则,就是那个点击位置的xpath有问题,其他都运行很好。这个网站我们曾经为某金融机构监控了一年,采集没有问题。

第一次运行飞掠模式的时候,有可能会失败,因为为飞掠窗口加载爬虫规则会遇到问题,第二次就好了。

注意看我的截图,我这里为飞掠窗口显示了日志窗口,通常是调试程序的时候显示出来,看看状态有没有正常刷新。正式运行的时候最好关闭,因为会挡住点击位置。打开的方法是在集搜客浏览器菜单上,配置-》隐藏日志窗口


本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报
地板
xiaogang184211 初级会员 发表于 2020-8-31 11:29:10 | 只看该作者
Fuller 发表于 2020-8-31 11:16
我正在测试你的规则,我看到你的点击xpath是 //*[@id='publicityOtherList']//td
这是点击td元素节点,我 ...

改了后,跳转页面没有进行采集操作
举报
5#
Fuller 管理员 发表于 2020-8-31 11:47:29 | 只看该作者
xiaogang184211 发表于 2020-8-31 11:29
改了后,跳转页面没有进行采集操作

重新运行一次试试,第一次飞掠可能会失败,后面就好了。我测试的采集和翻页都没有问题
举报
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 360或火绒等杀毒软件导致GooSeeker爬虫软件
  • 话题分析(NMF模型和LDA模型)软件的安装和
  • 运行Apple无法验证的程序的方法
  • 文本聚类分析软件的安装和使用方法
  • 利用AI阅读和分析文本:扣子COZE记录用户反

热门用户

GMT+8, 2025-5-11 08:01