我做了个采集微博搜索消息的规则,测试没有问题,可是每次用DS打数机爬取的时候,都是到第3页就停止。
我应该怎样设置呢?
举报 使用道具
| 回复

共 6 个关于本帖的回复 最后回复于 2016-9-9 09:51

沙发
shenzhenwan10 金牌会员 发表于 2016-9-9 09:46:46 | 只看该作者
你看看第3页的翻页结构和前2页是不是不一样
举报 使用道具
板凳
中秋2016 中级会员 发表于 2016-9-9 09:47:12 | 只看该作者
我看了一下,微博第四页的下一页和第三页没什么区别啊
但是每次都只抓取三页就停止了
举报 使用道具
地板
shenzhenwan10 金牌会员 发表于 2016-9-9 09:48:05 | 只看该作者
你先看看人手去翻页,翻到第5,第6页有没有问题
某些情况微博会不显示内容
举报 使用道具
5#
中秋2016 中级会员 发表于 2016-9-9 09:49:34 | 只看该作者
我看了,没有问题,人手翻页可以看到内容。
另外,我是用的爬虫群抓取,是先激活所有线索,然后启动爬虫群
举报 使用道具
6#
shenzhenwan10 金牌会员 发表于 2016-9-9 09:51:19 | 只看该作者
如果你设置了爬虫群,检查一下有没有限制翻页数
另外微博抓取需要开启滚屏,你把滚屏次数设置大一些,比如15
举报 使用道具
7#
中秋2016 中级会员 发表于 2016-9-9 09:51:39 | 只看该作者
解决了,谢谢你
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-19 23:31