这个爬虫路线只能爬第一页,为什么不能继续往下爬,要怎么制作往下爬的规则?谢谢!
举报 使用道具
| 回复

共 10 个关于本帖的回复 最后回复于 2018-4-29 00:07

沙发
bowieD 金牌会员 发表于 2018-4-27 16:46:15 | 只看该作者
规则名是校园贷8 吗? 运行了这个规则,可以正常翻页啊
举报 使用道具
板凳
0098765 新手上路 发表于 2018-4-28 17:00:52 | 只看该作者
bowieD 发表于 2018-4-27 16:46
规则名是校园贷8 吗? 运行了这个规则,可以正常翻页啊

这个怎么只能爬第一页啊?是不是哪里设置的不对?谢谢!

3.png (108.8 KB, 下载次数: 597)

3.png
举报 使用道具
地板
yangwenge 金牌会员 发表于 2018-4-28 17:44:35 | 只看该作者
本帖最后由 yangwenge 于 2018-4-28 17:47 编辑
0098765 发表于 2018-4-28 17:00
这个怎么只能爬第一页啊?是不是哪里设置的不对?谢谢!

加载你的规则测试了下,是能正常翻页的,规则没有问题。
是不是打数机关闭了什么加载项?可以在打数机菜单栏配置---浏览器配置中看看将插件,图片和JS都勾上

举报 使用道具
5#
0098765 新手上路 发表于 2018-4-28 18:14:19 | 只看该作者
yangwenge 发表于 2018-4-28 17:44
加载你的规则测试了下,是能正常翻页的,规则没有问题。
是不是打数机关闭了什么加载项?可以在打数机菜单 ...

都勾了的


举报 使用道具
6#
0098765 新手上路 发表于 2018-4-28 18:50:38 | 只看该作者
yangwenge 发表于 2018-4-28 17:44
加载你的规则测试了下,是能正常翻页的,规则没有问题。
是不是打数机关闭了什么加载项?可以在打数机菜单 ...

还是只爬完第一页就显示采集成功啊,怎么办?

举报 使用道具
7#
Fuller 管理员 发表于 2018-4-28 18:56:26 | 只看该作者

我测试你的规则,用查看规则,看到


这样的xpath,开始定位的其实DOM节点离着翻页区很远,规则很容易受到页面结构变化的影响。你可以重新设置一下定位偏好



应该设法把翻页区的P[@id='page']用上,这个定位表示是个class,所以,不要用偏好class,我选择了任何一个,就是自动选择最靠近翻页区的那个,也许是class,也许是id

任何一个428185244.png (149.23 KB, 下载次数: 611)

任何一个428185244.png
举报 使用道具
8#
0098765 新手上路 发表于 2018-4-28 19:29:14 | 只看该作者
Fuller 发表于 2018-4-28 18:56
我测试你的规则,用查看规则,看到

可以了,谢谢!
举报 使用道具
9#
shenghao011 新手上路 发表于 2018-4-28 23:08:30 | 只看该作者
谁能教我怎么爬美团和大众点评上的商家手机号啊?研究了几天都不会啊,
举报 使用道具
10#
maomao 论坛元老 发表于 2018-4-29 00:04:45 | 只看该作者
shenghao011 发表于 2018-4-28 23:08
谁能教我怎么爬美团和大众点评上的商家手机号啊?研究了几天都不会啊,
...

你可以按顺序看这三个入门视频。http://www.gooseeker.com/doc/forum-53-1.html

举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-20 01:26