751#
Fuller 管理员 发表于 2018-11-12 09:01:17 | 只看该作者
玉汝于成 发表于 2018-11-11 21:19
在”微博关键词采集“是,细分时间段时为什么没有24时呢?如果以小时为间隔,那就没有23:00——24:00的数据 ...

微博的分时策略变了,微博也没有24,所有我们没有24,以前0-23就跨了24个小时,现在变了,要当天0点-下一天0点才能够24小时
举报 使用道具
752#
玉汝于成 初级会员 发表于 2018-11-12 11:17:46 | 只看该作者
Fuller 发表于 2018-11-12 09:01
微博的分时策略变了,微博也没有24,所有我们没有24,以前0-23就跨了24个小时,现在变了,要当天0点-下一 ...

这样的啊。谢谢您!
举报 使用道具
753#
玉汝于成 初级会员 发表于 2018-11-14 10:10:01 | 只看该作者
我添加了多个线索后点击了“启动采集”,打数机貌似正常工作,但是状态中一直显示“待启动”,刷新了好多次都没用。这样我就不知道数据的真实采集状态了。这是怎么回事?怎样解决?
谢谢!
举报 使用道具
754#
Fuller 管理员 发表于 2018-11-14 10:44:41 | 只看该作者
玉汝于成 发表于 2018-11-14 10:10
我添加了多个线索后点击了“启动采集”,打数机貌似正常工作,但是状态中一直显示“待启动”,刷新了好多次 ...

你可能加了很多,前面的还没有采集到,所以一直显示待采集,翻页看看后面的任务,是不是待采集的越来越少了
举报 使用道具
755#
玉汝于成 初级会员 发表于 2018-11-14 11:30:46 | 只看该作者
Fuller 发表于 2018-11-14 10:44
你可能加了很多,前面的还没有采集到,所以一直显示待采集,翻页看看后面的任务,是不是待采集的越来越少 ...

谢谢。可能是系统的原因。

举报 使用道具
756#
玉汝于成 初级会员 发表于 2018-11-14 21:51:02 | 只看该作者
微博关键词采集下没办法采集到全部的博文吗?就是被“展开全文”隐藏了的内容怎么采集到?
谢谢!
举报 使用道具
757#
Fuller 管理员 发表于 2018-11-15 08:57:53 | 只看该作者
玉汝于成 发表于 2018-11-14 21:51
微博关键词采集下没办法采集到全部的博文吗?就是被“展开全文”隐藏了的内容怎么采集到?
谢谢! ...

微博工具箱中的微博关键词工具没有做点击动作,需要另外做规则
举报 使用道具
758#
maomao 论坛元老 发表于 2018-11-15 10:08:47 | 只看该作者
玉汝于成 发表于 2018-11-14 21:51
微博关键词采集下没办法采集到全部的博文吗?就是被“展开全文”隐藏了的内容怎么采集到?
谢谢! ...

可以用这个快捷工具,把博文网址输入到这个快捷工具里,就可以采集微博全文。
https://www.gooseeker.com/res/da ... 8%E9%87%87%E9%9B%86
举报 使用道具
759#
玉汝于成 初级会员 发表于 2018-11-15 10:51:20 | 只看该作者
Fuller 发表于 2018-11-15 08:57
微博工具箱中的微博关键词工具没有做点击动作,需要另外做规则

想用关键词采集微博数据时,是既可以直接用“关键词采集”,也可以通过“定义规则”来采集吗?
举报 使用道具
760#
Fuller 管理员 发表于 2018-11-15 11:45:27 | 只看该作者
玉汝于成 发表于 2018-11-15 10:51
想用关键词采集微博数据时,是既可以直接用“关键词采集”,也可以通过“定义规则”来采集吗?
...

可以类似这个攻略上说的:https://www.gooseeker.com/doc/thread-5399-1-1.html
一个工具产生的结果内容作为另一个工具或者自定义规则的输入。

比如,我们自己采集微博展开的全文的时候并不另外定义一个规则做点击展开,而是在关键词搜索工具采集完成以后,把微博网址导入到另一个工具或者规则
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-2 13:29