我要爬的是微博数据,按照省份来分类,所以制作了一个北京的之后,在这个基础上复制了其他省份的,但是做完发现复制的规则不能实现翻页功能,采集完链接的第一页就结束了。我复制后的规则名为“乡村振兴1013-广东”
求助一下!
举报 使用道具
| 回复

共 3 个关于本帖的回复 最后回复于 2018-10-16 19:13

沙发
Fuller 管理员 发表于 2018-10-16 18:56:19 | 只看该作者
我正在看你的规则,还没有细看,我产生了一个疑问:为什么要复制规则?而不是添加线索?添加线索很容易
举报 使用道具
板凳
Fuller 管理员 发表于 2018-10-16 19:04:20 | 只看该作者
翻页规则做的不太合适,加载是失败的,根据这个截图看,里面有用position()函数的绝对定位,很容易失效。我再看看怎样改进


举报 使用道具
地板
Fuller 管理员 发表于 2018-10-16 19:13:40 | 只看该作者


应该这样选择翻页区,也可以用更高的那个节点,也就是div[@class='m-page']那个节点也可以,这样生成的翻页规则很短,适应性很强
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-27 01:41