如题,在网页上点击了“启动采集”按钮,启动了两个DS打数机,一个采集微博列表,另一个采集百度列表,但是我只要微博的数据,这种情况怎么办
举报 使用道具
| 回复

共 7 个关于本帖的回复 最后回复于 2016-12-12 11:01

沙发
quyixuan 金牌会员 发表于 2016-12-12 10:57:48 | 只看该作者
百度?以前你添加了任务吧
不想启动百度的先删除之前添加的百度的任务
举报 使用道具
板凳
七月等 中级会员 发表于 2016-12-12 10:58:21 | 只看该作者
quyixuan 发表于 2016-12-12 10:57
百度?以前你添加了任务吧
不想启动百度的先删除之前添加的百度的任务

我用的微博采集工具箱,只添加了这一个任务,
以前的删掉了

难道是和我的关键词有关?

举报 使用道具
地板
quyixuan 金牌会员 发表于 2016-12-12 10:59:26 | 只看该作者
七月等 发表于 2016-12-12 10:58
我用的微博采集工具箱,只添加了这一个任务,
以前的删掉了

跟关键词没关系
你之前有没有用过百度的工具?

这三个用过没有

举报 使用道具
5#
七月等 中级会员 发表于 2016-12-12 10:59:57 | 只看该作者
quyixuan 发表于 2016-12-12 10:59
跟关键词没关系
你之前有没有用过百度的工具?

没有,直接用的集微库

举报 使用道具
6#
quyixuan 金牌会员 发表于 2016-12-12 11:00:14 | 只看该作者
七月等 发表于 2016-12-12 10:59
没有,直接用的集微库

那就把采集百度列表的DS直接关了

举报 使用道具
7#
七月等 中级会员 发表于 2016-12-12 11:01:24 | 只看该作者
quyixuan 发表于 2016-12-12 11:00
那就把采集百度列表的DS直接关了

我看使用交流中说关键词搜索结果最多能抓取31页,可现在我看DS打数机已经抓取了45页了,那我最后采集到的数据中31页之后的是不是都是空白啊?


举报 使用道具
8#
quyixuan 金牌会员 发表于 2016-12-12 11:01:39 | 只看该作者
七月等 发表于 2016-12-12 11:01
我看使用交流中说关键词搜索结果最多能抓取31页,可现在我看DS打数机已经抓取了45页了,那我最后采集到 ...

不是最多抓取31页
是让你尽量每个任务分成小于或等于31页
这样可以降低失败的概率
翻页能翻到多少,就能抓到多少页


举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-28 19:45