主题:b站广播剧
记号线索和相对线索都翻不了,第2页以后就结束了
举报 使用道具
| 回复

共 5 个关于本帖的回复 最后回复于 2018-11-4 17:19

沙发
Fuller 管理员 发表于 2018-11-2 14:33:17 | 只看该作者

“下一页”前后有空格,肯定到下一页以后空格数量变化了,所以,不要勾选全匹配,然后把前后的空格删除
举报 使用道具
板凳
sakura4444 初级会员 发表于 2018-11-3 09:41:56 | 只看该作者
Fuller 发表于 2018-11-2 14:33
“下一页”前后有空格,肯定到下一页以后空格数量变化了,所以,不要勾选全匹配,然后把前后的空格删除
...

按这么做了,还是翻不了第三页T T
举报 使用道具
地板
文学作品动态扫描 金牌会员 发表于 2018-11-3 15:16:25 | 只看该作者
sakura4444 发表于 2018-11-3 09:41
按这么做了,还是翻不了第三页T T

经测试,似乎遇到了一个bug,我们正在检查问题的原因
举报 使用道具
5#
Fuller 管理员 发表于 2018-11-3 19:22:05 | 只看该作者
文学作品动态扫描 发表于 2018-11-3 15:16
经测试,似乎遇到了一个bug,我们正在检查问题的原因

开发人员检查过了,不是程序bug,还是规则没有做好。用你的规则点击测试按钮,查看数据规则
数据规则中有很多postion函数,这是一种绝对定位的方式,到下一页后,position位置就变了,所以规则不适应了。这是因为你没有采用定位标志映射以精确划定采集范围,而爬虫自己选的定位标志不够优化,只需做如下设置:

在定位偏好那里,勾上“只用class”,在DOM树上可以看到,每个li节点的共同父节点UL刚好有个class属性,可以作为定位标志,这样生成的采集规则就是最短的,中间没有position定位函数。

这样修改以后,就能顺利翻页了
举报 使用道具
6#
sakura4444 初级会员 发表于 2018-11-4 17:19:29 | 只看该作者
谢谢!
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-19 17:41