11#
kevinjin 中级会员 发表于 2017-5-25 14:39:50 | 只看该作者
Fuller 发表于 2017-5-24 21:06
不要用绝对定位,那样很容易受网页结构变化的影响,用偏好class 这是我测试用的,其实定位到li就行了

还是不行,不好意思,麻烦帮我看一下。






本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
12#
Fuller 管理员 发表于 2017-5-25 16:59:16 | 只看该作者
kevinjin 发表于 2017-5-25 14:39
还是不行,不好意思,麻烦帮我看一下。



你仔细观察DS打数机的运行,点击已经生效了,但是你做的抓取规则有问题。

注意看上图,总是显示两个榜单,第一个总是本场的,第二个根据你点击的哪个按钮,显示本周或者上周。

所以,做规则的时候一定要确保采集的是第二个榜单的。这个榜单的class和结构完全一样。要么简单处理,你给抓取内容用上定位标志映射采集多样例也用定位标志映射,而不用样例复制。这样就能把两个榜单同时采集下来,前10个是本场,后10个是下周

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
13#
kevinjin 中级会员 发表于 2017-5-25 18:11:49 | 只看该作者
Fuller 发表于 2017-5-25 16:59
你仔细观察DS打数机的运行,点击已经生效了,但是你做的抓取规则有问题。

注意看上图,总是显示两个榜 ...

抓的还是本周的,抓不到上周的。 不好意思,能不能给我一个操作截图,非常感谢,或者能不能加一下QQ 1099053079 远程操作一下,谢谢。
举报 使用道具
14#
Fuller 管理员 发表于 2017-5-25 18:25:06 | 只看该作者
kevinjin 发表于 2017-5-25 18:11
抓的还是本周的,抓不到上周的。 不好意思,能不能给我一个操作截图,非常感谢,或者能不能加一下QQ 1099 ...


我是这样做的
1,最顶层的做了一个定位标志映射,为了限定一下范围
2,多加了一层“层”,用来做样例复制
3,抓取内容做了定位标志映射

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
15#
kevinjin 中级会员 发表于 2017-5-26 16:30:22 | 只看该作者
Fuller 发表于 2017-5-25 18:25
我是这样做的
1,最顶层的做了一个定位标志映射,为了限定一下范围
2,多加了一层“层”,用来做样例复 ...

貌似还是不行诶,心累。真的麻烦你了。




本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
16#
Fuller 管理员 发表于 2017-5-26 17:38:42 | 只看该作者
kevinjin 发表于 2017-5-26 16:30
貌似还是不行诶,心累。真的麻烦你了。


我针对你的新规则只做了一点改动:在第一级 “主播点击”的连续动作那里,点击“高级设置”,给这个动作增加3秒的额外延迟,也许你没有延迟,那时候网页上的内容没有显示出来。你看下面截图,我就能采集下来上周榜


本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
17#
kevinjin 中级会员 发表于 2017-5-27 23:43:14 | 只看该作者
Fuller 发表于 2017-5-26 17:38
我针对你的新规则只做了一点改动:在第一级 “主播点击”的连续动作那里,点击“高级设置”,给这个动作 ...

已经OK了 真的非常感谢。
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 利用AI阅读和分析文本:扣子COZE记录用户反
  • 在网页片段内直观标注——以B站评论采集为
  • 利用AI阅读和分析文本:使用COZE建设游记文
  • 使用AI工具Kimi生成python代码为文本分析结
  • 苹果mac电脑安装集搜客网络爬虫软件失败的

热门用户

GMT+8, 2024-11-22 23:07