chen_tian_cai 新手上路 发表于 2019-4-9 20:26:31 | 显示全部楼层
Fuller 发表于 2019-4-9 11:21
如果翻页规则不正确,看不到翻页,也不会有错误信息显示

捕获.PNG

设置翻页记号遇到如上图所示,没有text结点,昨天点了@class、@ka都失败了,请问是什么原因呢,地址如下:
https://www.zhipin.com/c101210100/?query=%E6%95%B0%E6%8D%AE%E5%88%86%E6%9E%90&page=1&ka=page-prev
举报 使用道具
Fuller 管理员 发表于 2019-4-9 20:59:34 | 显示全部楼层
chen_tian_cai 发表于 2019-4-9 20:26
设置翻页记号遇到如上图所示,没有text结点,昨天点了@class、@ka都失败了,请问是什么原因呢,地址如 ...

你做的规则的主题名是什么? 发出来帮你检查一下原因
举报 使用道具
chen_tian_cai 新手上路 发表于 2019-4-9 21:21:47 | 显示全部楼层
Fuller 发表于 2019-4-9 20:59
你做的规则的主题名是什么? 发出来帮你检查一下原因

BOSS直聘HZ数据分析岗位爬取

谢谢!
举报 使用道具
Fuller 管理员 发表于 2019-4-9 22:12:26 | 显示全部楼层
chen_tian_cai 发表于 2019-4-9 21:21
BOSS直聘HZ数据分析岗位爬取

谢谢!

首先,尽量不要用绝对定位,你看数据规则中那么多position函数,那些位置只要有稍许变化,就规则失效了
绝对定位20190409221057.png
举报 使用道具
Fuller 管理员 发表于 2019-4-9 22:28:12 | 显示全部楼层
定位20190409222448.png

你用这个a节点映射给公司名称,如果定位偏好设置成偏好class,就会自动选择@class = 'name',但是网页上有好多name,就会采错了,为了解决这个问题,用上定位标志映射,手工指定一个定位标志,就是上面那个class,跳过name,这样就可以放心使用偏好class了。规则的适应性也提高了
举报 使用道具
chen_tian_cai 新手上路 发表于 2019-4-9 22:39:48 | 显示全部楼层
Fuller 发表于 2019-4-9 22:12
首先,尽量不要用绝对定位,你看数据规则中那么多position函数,那些位置只要有稍许变化,就规则失效了

...

管理员大大,真是太感谢你了,用了偏好class就爬取成功了,很好,谢谢您了耶
举报 使用道具
才子 新手上路 发表于 2019-9-6 14:45:00 | 显示全部楼层
https://www.meituan.com/xiuxianyule/4661781/想统计商家名称,电话,地址,为什么翻不了页,都是按照上面操作做的
举报 使用道具
Fuller 管理员 发表于 2019-9-6 14:55:08 | 显示全部楼层
才子 发表于 2019-9-6 14:45
https://www.meituan.com/xiuxianyule/4661781/想统计商家名称,电话,地址,为什么翻不了页,都是按照上面 ...

你的任务名是什么?发出来我给你检查一下
举报 使用道具
才子 新手上路 发表于 2019-9-6 17:06:27 | 显示全部楼层
Fuller 发表于 2019-9-6 14:55
你的任务名是什么?发出来我给你检查一下

按摩足疗列表
举报 使用道具
Fuller 管理员 发表于 2019-9-6 18:22:50 | 显示全部楼层

翻页20190906182159.png

加载你的规则,出现上面的错误,翻页规则很奇怪,我查查是什么原因
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-29 13:32