761#
玉汝于成 初级会员 发表于 2018-11-16 10:25:44 | 只看该作者
Fuller 发表于 2018-11-15 11:45
可以类似这个攻略上说的:https://www.gooseeker.com/doc/thread-5399-1-1.html
一个工具产生的结果内容 ...

好的,我试试。谢谢您!!
举报 使用道具
762#
玉汝于成 初级会员 发表于 2018-11-16 10:33:24 | 只看该作者
maomao 发表于 2018-11-15 10:08
可以用这个快捷工具,把博文网址输入到这个快捷工具里,就可以采集微博全文。
https://www.gooseeker.com ...

非常有用,谢谢您!!
举报 使用道具
763#
shuuu2018 新手上路 发表于 2018-11-18 16:31:33 | 只看该作者
您好!请问收集博主主页为什么看不到完整的博文呢,只有“展开全文”这样,那收集就不完整了。用了前面楼提到的快捷工具也不行,难道不能批量采集完整的微博吗?
举报 使用道具
764#
Fuller 管理员 发表于 2018-11-18 18:05:03 | 只看该作者
shuuu2018 发表于 2018-11-18 16:31
您好!请问收集博主主页为什么看不到完整的博文呢,只有“展开全文”这样,那收集就不完整了。用了前面楼提 ...

在关键词搜索这个工具中,没有点击“展开全文”,只能用另一个工具配合在一起才能采集全:https://www.gooseeker.com/res/da ... 8%E9%87%87%E9%9B%86

用关键词搜索工具采集列表,从导出的结果中把微博详情网址提取出来,导入到第二个工具
举报 使用道具
765#
shuuu2018 新手上路 发表于 2018-11-18 18:58:01 | 只看该作者
为什么我新建的第二个采集任务点“打包”显示0条数据,试了好多次都是这样,明明第一个的时候是正常的
举报 使用道具
766#
Fuller 管理员 发表于 2018-11-18 23:30:26 | 只看该作者
第二个任务执行了吗?打数机动作了?有没有删除采集任务?
举报 使用道具
767#
shuuu2018 新手上路 发表于 2018-11-19 00:58:50 | 只看该作者
Fuller 发表于 2018-11-18 23:30
第二个任务执行了吗?打数机动作了?有没有删除采集任务?

执行了,显示已采集,打数机是怎么看...看到有在不停翻页,我觉得应该是执行了吧。删了又试好几次,还是这样,显示已采集,但是点打包说0条数据,点任务也看不到默认显示的最新10条数据
举报 使用道具
768#
Fuller 管理员 发表于 2018-11-19 08:54:56 | 只看该作者
shuuu2018 发表于 2018-11-19 00:58
执行了,显示已采集,打数机是怎么看...看到有在不停翻页,我觉得应该是执行了吧。删了又试好几次,还是 ...

微博工具采集的时候,会运行起来两个爬虫群窗口,一个采集,一个打包,两个都不用关
举报 使用道具
769#
Akira_Chartte 新手上路 发表于 2018-11-24 15:49:12 | 只看该作者
打算采一个博主的所有微博,但是停在1000多条就显示采集完成了,不知道什么原因,还有5万多条没采,是有条数限制还是时间限制?
举报 使用道具
770#
Fuller 管理员 发表于 2018-11-24 15:57:46 | 只看该作者
Akira_Chartte 发表于 2018-11-24 15:49
打算采一个博主的所有微博,但是停在1000多条就显示采集完成了,不知道什么原因,还有5万多条没采,是有条 ...

因为太多了,一口翻页完成的可能性很小。不过采集博主的所有微博的话,每个分页都有独立网址的,网址中含有页码参数,你把断掉的那个页码填到网址中,然后把这个网址再加到采集工具中,就会从那里开始接上采集
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-2 14:59