931#
Fuller 管理员 发表于 2019-9-5 17:06:30 | 只看该作者
lalaxiaoer 发表于 2019-9-5 15:16
想问一下可以同时设置地理定位规则和关键词条件吗,就像微博高级搜索里设置城市名一样 ...

在微博采集工具箱中,界面上定死了,只能选择那些条件。但是要是有自己的采集规则,那就容易了,先预先选好地理和关键词,就能得到一个独特的网址,是含有地理等信息的。把这个网址添加给这个规则,就是爬了。

比如,这里是关键词搜索的规则:https://www.gooseeker.com/res/detail_114518.html
这里是添加网址的方法:https://www.gooseeker.com/doc/thread-667-1-1.html
举报 使用道具
932#
lalaxiaoer 初级会员 发表于 2019-9-6 09:02:34 | 只看该作者
Fuller 发表于 2019-9-5 17:06
在微博采集工具箱中,界面上定死了,只能选择那些条件。但是要是有自己的采集规则,那就容易了,先预先选 ...

嗯嗯,十分感谢
举报 使用道具
933#
weibo336658 初级会员 发表于 2019-9-6 21:48:37 | 只看该作者
采集出来的关注渠道为什么会出现手机型号啊,能告知一下吗?
举报 使用道具
934#
Fuller 管理员 发表于 2019-9-7 11:18:09 | 只看该作者
weibo336658 发表于 2019-9-6 21:48
采集出来的关注渠道为什么会出现手机型号啊,能告知一下吗?

微博有个很好的功能:就是能显示用户发消息的时候所用的手机型号。

这个信息有很多用处,比如,做手机消费者洞察,分析不同型号手机的人群,分析换机模式等等
举报 使用道具
935#
medicago 初级会员 发表于 2019-9-8 16:01:18 | 只看该作者
请问能否增加微博阅读量数据采集呢?

举报 使用道具
936#
Fuller 管理员 发表于 2019-9-8 23:38:34 | 只看该作者
medicago 发表于 2019-9-8 16:01
请问能否增加微博阅读量数据采集呢?

只有自己的微博才能看到阅读量,可以按照教程自己做一个采集规则
举报 使用道具
937#
pingpingand 新手上路 发表于 2019-9-10 15:07:23 | 只看该作者
请问有没有自己定义规则的文档说明?谢谢!
举报 使用道具
938#
maomao 论坛元老 发表于 2019-9-10 15:29:38 | 只看该作者
pingpingand 发表于 2019-9-10 15:07
请问有没有自己定义规则的文档说明?谢谢!

教程https://www.gooseeker.com/tuto/tutorial.html 请看左侧 初级教程 学习做规则采数据

入门视频教程:https://www.gooseeker.com/doc/forum-53-1.html

使用过程中有问题请加用户群676198154,有技术支持。

举报 使用道具
939#
goeiy_ 新手上路 发表于 2019-9-20 11:08:28 | 只看该作者
请问微博关键词搜索时间段大概三天采集要多久呢?为什么已经两天了程序还在爬?
举报 使用道具
940#
Fuller 管理员 发表于 2019-9-20 11:14:09 | 只看该作者
goeiy_ 发表于 2019-9-20 11:08
请问微博关键词搜索时间段大概三天采集要多久呢?为什么已经两天了程序还在爬? ...

你观察一下DS打数机的浏览器窗口,微博内容在变化吗?

如果只有一个关键词:假设把要采集的内容按照“1小时”分割,那么一天有24个小时,假设每个时间段有50个分页,那么一天总共24*50=1200页,如果一页8秒钟,那么需要9600秒,采集三天的就需要28,800秒,很快会采集完的。

除非采集过程中有失败的,每次失败会等待60秒,这样就变得很慢了
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-26 21:20