我做了个采集微博搜索消息的规则,测试没有问题,可是每次用DS打数机爬取的时候,都是到第3页就停止。
我应该怎样设置呢?
举报 使用道具
| 回复

共 6 个关于本帖的回复 最后回复于 2016-9-9 09:51

沙发
shenzhenwan10 金牌会员 发表于 2016-9-9 09:46:46 | 只看该作者
你看看第3页的翻页结构和前2页是不是不一样
举报 使用道具
板凳
中秋2016 中级会员 发表于 2016-9-9 09:47:12 | 只看该作者
我看了一下,微博第四页的下一页和第三页没什么区别啊
但是每次都只抓取三页就停止了
举报 使用道具
地板
shenzhenwan10 金牌会员 发表于 2016-9-9 09:48:05 | 只看该作者
你先看看人手去翻页,翻到第5,第6页有没有问题
某些情况微博会不显示内容
举报 使用道具
5#
中秋2016 中级会员 发表于 2016-9-9 09:49:34 | 只看该作者
我看了,没有问题,人手翻页可以看到内容。
另外,我是用的爬虫群抓取,是先激活所有线索,然后启动爬虫群
举报 使用道具
6#
shenzhenwan10 金牌会员 发表于 2016-9-9 09:51:19 | 只看该作者
如果你设置了爬虫群,检查一下有没有限制翻页数
另外微博抓取需要开启滚屏,你把滚屏次数设置大一些,比如15
举报 使用道具
7#
中秋2016 中级会员 发表于 2016-9-9 09:51:39 | 只看该作者
解决了,谢谢你
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 话题分析(NMF模型和LDA模型)软件的安装和
  • 运行Apple无法验证的程序的方法
  • 文本聚类分析软件的安装和使用方法
  • 利用AI阅读和分析文本:扣子COZE记录用户反
  • 在网页片段内直观标注——以B站评论采集为

热门用户

GMT+8, 2025-2-7 00:13