381#
Fuller 管理员 发表于 2017-3-12 18:49:38 | 只看该作者
lzh3366 发表于 2017-3-12 17:15
为什么我选了微博关键词搜索下,时间为2016年某天的微博抓取,抓到的数据只有10条??而且都是今天的微博 ...

你应该是没有登录微博。如果使用GS网络爬虫,就在GS浏览器中先登录微博,再运行爬虫。如果你用的是Firefox插件版,就先在Firefox中登录微博
举报 使用道具
382#
sunshine_h2so4 初级会员 发表于 2017-3-22 09:40:45 | 只看该作者
为什么有些博文独立网址在采集的最后都会显示出错?
举报 使用道具
383#
xandy 论坛元老 发表于 2017-3-22 09:43:07 | 只看该作者
sunshine_h2so4 发表于 2017-3-22 09:40
为什么有些博文独立网址在采集的最后都会显示出错?

检查你添加的任务的链接是不是正确的,具体什么问题可以描述清楚点
举报 使用道具
384#
sunshine_h2so4 初级会员 发表于 2017-3-22 09:52:11 | 只看该作者
如果抓取的博文转发数特别多,DS打数机会在爬取数据翻到最后一页的时候,显示匹配失败
对了,购买专业版的集搜客可以无限量地打包数据吗
举报 使用道具
385#
xandy 论坛元老 发表于 2017-3-22 10:01:56 | 只看该作者
sunshine_h2so4 发表于 2017-3-22 09:52
如果抓取的博文转发数特别多,DS打数机会在爬取数据翻到最后一页的时候,显示匹配失败
对了,购买专业版的 ...

评论和转发微博本身是限制翻页的,转发和评论多的话不可能一翻到底。
旗舰版才支持无限打包。
具体看这里:《windows版爬虫功能列表
举报 使用道具
386#
sunshine_h2so4 初级会员 发表于 2017-3-22 10:10:11 | 只看该作者
xandy 发表于 2017-3-22 10:01
评论和转发微博本身是限制翻页的,转发和评论多的话不可能一翻到底。
旗舰版才支持无限打包。
具体看这里 ...

那抓取这种转发数多的微博有什么相应的处理措施吗?
专业版和免费版打包数据都是1积分20条数据吗

举报 使用道具
387#
xandy 论坛元老 发表于 2017-3-22 10:13:43 | 只看该作者
sunshine_h2so4 发表于 2017-3-22 10:10
那抓取这种转发数多的微博有什么相应的处理措施吗?
专业版和免费版打包数据都是1积分20条数据吗

调整抓取频率,放慢速度。购买专业版会送490积分。
举报 使用道具
388#
sunshine_h2so4 初级会员 发表于 2017-3-22 10:25:37 | 只看该作者
是设置DS打数机的“配置”-》“延迟抓取”和“超时时长”的数值吗?把它们的值设的大一些?
举报 使用道具
389#
xandy 论坛元老 发表于 2017-3-22 10:42:48 | 只看该作者
sunshine_h2so4 发表于 2017-3-22 10:25
是设置DS打数机的“配置”-》“延迟抓取”和“超时时长”的数值吗?把它们的值设的大一些? ...

可以看看这个帖子:抓取微博中断
举报 使用道具
390#
sunshine_h2so4 初级会员 发表于 2017-3-22 10:52:04 | 只看该作者
嗯呢
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 利用AI阅读和分析文本:扣子COZE记录用户反
  • 在网页片段内直观标注——以B站评论采集为
  • 利用AI阅读和分析文本:使用COZE建设游记文
  • 使用AI工具Kimi生成python代码为文本分析结
  • 苹果mac电脑安装集搜客网络爬虫软件失败的

热门用户

GMT+8, 2024-10-19 06:23