功能就是要实现切换标签后从新抓取页面的数据开始使用记号线索的方式跳到下一个主题抓取的,后来发现记号位置的文字不是固定的
后来改用了连续动作的方式,但是进行抓取的时候报了错(xpath是没问题的)


主题名:
胜负_任九500_1期
胜负_任九500_2期
胜负_任九500_3期

说明:
点击期数会切换页面,每页的抓取规则其实是一样的
现在运行抓取以后,第1、2页是抓好了,跳第3页报错了
1-2是使用记号线索的方式,2-3是使用连续动作的方式

PS:
这页应该有更简单的实现方式,麻烦版主或会玩的大神给个例子~谢谢

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
| 回复

共 2 个关于本帖的回复 最后回复于 2017-1-17 17:06

沙发
HJLing 版主 发表于 2017-1-17 16:46:47 | 只看该作者
我另存了你的规则 从第一个规则开始运行 模拟点击和连续动作都顺利执行了 没有报错

建议你直接用一个规则来采就可以了 因为无论点哪一期 要采的内容都是一样的 一个规则就可以了
用连续动作去点击 定位表达式: //*[@id='expect_tab']/a[contains(@class,'on')]/following-sibling::a[1]

需要注意的是重复次数要填2 这样才会点两期

还有 在内容映射那里的期号 加上定位标志映射 这样点击17008后 采到的期号也会是17008

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
板凳
plovex 初级会员 发表于 2017-1-17 17:06:32 | 只看该作者
收到~我试试
我就是想搞这个方法呢,不会写这块定位表达式
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 利用AI阅读和分析文本:扣子COZE记录用户反
  • 在网页片段内直观标注——以B站评论采集为
  • 利用AI阅读和分析文本:使用COZE建设游记文
  • 使用AI工具Kimi生成python代码为文本分析结
  • 苹果mac电脑安装集搜客网络爬虫软件失败的

热门用户

GMT+8, 2024-11-23 08:53