10 17726

翻页

0098765 于 2018-4-27 16:32 发表 [复制链接]
QQ截图20180427163133.png
这个爬虫路线只能爬第一页,为什么不能继续往下爬,要怎么制作往下爬的规则?谢谢!
举报 使用道具
| 回复

共 10 个关于本帖的回复 最后回复于 2018-4-29 00:07

bowieD 金牌会员 发表于 2018-4-27 16:46:15 | 显示全部楼层
规则名是校园贷8 吗? 运行了这个规则,可以正常翻页啊
举报 使用道具
0098765 新手上路 发表于 2018-4-28 17:00:52 | 显示全部楼层
bowieD 发表于 2018-4-27 16:46
规则名是校园贷8 吗? 运行了这个规则,可以正常翻页啊

这个怎么只能爬第一页啊?是不是哪里设置的不对?谢谢!
3.png
举报 使用道具
yangwenge 金牌会员 发表于 2018-4-28 17:44:35 | 显示全部楼层
本帖最后由 yangwenge 于 2018-4-28 17:47 编辑
0098765 发表于 2018-4-28 17:00
这个怎么只能爬第一页啊?是不是哪里设置的不对?谢谢!

加载你的规则测试了下,是能正常翻页的,规则没有问题。
是不是打数机关闭了什么加载项?可以在打数机菜单栏配置---浏览器配置中看看将插件,图片和JS都勾上

举报 使用道具
0098765 新手上路 发表于 2018-4-28 18:14:19 | 显示全部楼层
yangwenge 发表于 2018-4-28 17:44
加载你的规则测试了下,是能正常翻页的,规则没有问题。
是不是打数机关闭了什么加载项?可以在打数机菜单 ...

都勾了的


举报 使用道具
0098765 新手上路 发表于 2018-4-28 18:50:38 | 显示全部楼层
yangwenge 发表于 2018-4-28 17:44
加载你的规则测试了下,是能正常翻页的,规则没有问题。
是不是打数机关闭了什么加载项?可以在打数机菜单 ...

还是只爬完第一页就显示采集成功啊,怎么办?

举报 使用道具
Fuller 管理员 发表于 2018-4-28 18:56:26 | 显示全部楼层

我测试你的规则,用查看规则,看到
定位117.png

这样的xpath,开始定位的其实DOM节点离着翻页区很远,规则很容易受到页面结构变化的影响。你可以重新设置一下定位偏好



应该设法把翻页区的P[@id='page']用上,这个定位表示是个class,所以,不要用偏好class,我选择了任何一个,就是自动选择最靠近翻页区的那个,也许是class,也许是id
任何一个428185244.png
举报 使用道具
0098765 新手上路 发表于 2018-4-28 19:29:14 | 显示全部楼层
Fuller 发表于 2018-4-28 18:56
我测试你的规则,用查看规则,看到

可以了,谢谢!
举报 使用道具
shenghao011 新手上路 发表于 2018-4-28 23:08:30 | 显示全部楼层
谁能教我怎么爬美团和大众点评上的商家手机号啊?研究了几天都不会啊,
举报 使用道具
maomao 论坛元老 发表于 2018-4-29 00:04:45 | 显示全部楼层
shenghao011 发表于 2018-4-28 23:08
谁能教我怎么爬美团和大众点评上的商家手机号啊?研究了几天都不会啊,
...

你可以按顺序看这三个入门视频。http://www.gooseeker.com/doc/forum-53-1.html
入门视频截图.png
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-22 20:11