111#
goodhanbin 中级会员 发表于 2019-12-6 18:09:15 | 只看该作者
Fuller 发表于 2019-12-6 17:56
点击查看规则,看看生成的规则是什么。

另外,新版本上有个功能“模拟点击”,你把他勾上试试(就在你的 ...

翻页线索规则

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
112#
Fuller 管理员 发表于 2019-12-6 18:11:34 | 只看该作者
goodhanbin 发表于 2019-12-6 17:57
在第一页,至上而下,逐行的,反复采集

假设在第一页上翻页操作没有生效,爬虫感觉不到失败,因为爬虫还能看到内容,不知道是上一页的老内容。所以会再次做点击动作,关键是解决翻页问题。也可能翻页规则不正确,也可能是勾上“模拟点击”
举报 使用道具
113#
goodhanbin 中级会员 发表于 2019-12-6 18:12:25 | 只看该作者
Fuller 发表于 2019-12-6 18:11
假设在第一页上翻页操作没有生效,爬虫感觉不到失败,因为爬虫还能看到内容,不知道是上一页的老内容。所 ...

如何钩上模拟点击?
举报 使用道具
114#
Fuller 管理员 发表于 2019-12-6 18:13:01 | 只看该作者

点击“定位选项”,不要使用绝对定位,很容易失败的,使用“偏好class”或者“偏好id”,看看哪个最合适。

你做翻页区映射操作的时候,选择了哪个dom节点?
举报 使用道具
115#
goodhanbin 中级会员 发表于 2019-12-6 18:18:59 | 只看该作者
Fuller 发表于 2019-12-6 18:13
点击“定位选项”,不要使用绝对定位,很容易失败的,使用“偏好class”或者“偏好id”,看看哪个最合适 ...





本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
116#
goodhanbin 中级会员 发表于 2019-12-6 18:20:06 | 只看该作者

dom节点 和定位规则,有按要求做
举报 使用道具
117#
goodhanbin 中级会员 发表于 2019-12-6 18:30:00 | 只看该作者
Fuller 发表于 2019-12-6 18:13
点击“定位选项”,不要使用绝对定位,很容易失败的,使用“偏好class”或者“偏好id”,看看哪个最合适 ...

一级规则,无法做自动翻 ,在第一页至上而下,逐行重复采集,

只能,通过手动点翻页
举报 使用道具
118#
Fuller 管理员 发表于 2019-12-6 20:32:27 | 只看该作者
goodhanbin 发表于 2019-12-6 18:30
一级规则,无法做自动翻 ,在第一页至上而下,逐行重复采集,

只能,通过手动点翻页

勾上模拟点击,再点击查看规则,把生成的翻页规则截图出来看

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
119#
goodhanbin 中级会员 发表于 2019-12-7 09:14:54 | 只看该作者
Fuller 发表于 2019-12-6 20:32
勾上模拟点击,再点击查看规则,把生成的翻页规则截图出来看

翻页线索模拟点击规则

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
120#
Fuller 管理员 发表于 2019-12-7 09:35:41 | 只看该作者
goodhanbin 发表于 2019-12-7 09:14
翻页线索模拟点击规则

把红框这句xpath拷贝出来,拷入下图的输入框中,点击搜索,看看能否定位到那个翻页按钮,也看到能定位到几个




本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 利用AI阅读和分析文本:扣子COZE记录用户反
  • 在网页片段内直观标注——以B站评论采集为
  • 利用AI阅读和分析文本:使用COZE建设游记文
  • 使用AI工具Kimi生成python代码为文本分析结
  • 苹果mac电脑安装集搜客网络爬虫软件失败的

热门用户

GMT+8, 2024-11-23 18:10