1081#
WangYaTe_0824 新手上路 发表于 2020-4-18 18:56:47 | 只看该作者
Fuller 发表于 2020-4-18 08:03
阅读数只有微博作者能看,要自己做采集规则

原来如此,谢谢亲


举报 使用道具
1082#
wsmbpxy 新手上路 发表于 2020-4-27 11:15:55 | 只看该作者
展开全文后的数据怎么爬取
举报 使用道具
1083#
Fuller 管理员 发表于 2020-4-27 11:23:01 | 只看该作者
wsmbpxy 发表于 2020-4-27 11:15
展开全文后的数据怎么爬取

用关键词搜索工具爬下来的微博?

如果是这样得到的微博,导出数据以后,在excel中筛选一下含有“展开全文”的微博,把这些网址收集起来,导入到这个快捷采集工具:微博博文展开全部采集
举报 使用道具
1084#
orangestar 新手上路 发表于 2020-4-27 13:10:31 | 只看该作者
想问一下,这个爬取微博的时候,地点的设定是根据发博人的IP地址,还是根据博主自己设定的信息?
举报 使用道具
1085#
ym 版主 发表于 2020-4-27 14:26:33 | 只看该作者
orangestar 发表于 2020-4-27 13:10
想问一下,这个爬取微博的时候,地点的设定是根据发博人的IP地址,还是根据博主自己设定的信息? ...

如果有提供地区的筛选,那么这个就是根据IP地址区分的,这是微博自身设定,不是爬虫这边设定的,爬虫只是帮忙把信息抓取回来

举报 使用道具
1086#
orangestar 新手上路 发表于 2020-4-30 17:28:44 | 只看该作者
ym 发表于 2020-4-27 14:26
如果有提供地区的筛选,那么这个就是根据IP地址区分的,这是微博自身设定,不是爬虫这边设定的,爬虫只是 ...

哦哦哦 了解 谢谢!

举报 使用道具
1087#
程天宇 新手上路 发表于 2020-5-2 10:36:38 | 只看该作者
我想问下,为什么它不会自动翻页呢?是需要另外的设置吗,我爬完之后只有第一页的内容
举报 使用道具
1088#
Fuller 管理员 发表于 2020-5-2 11:05:29 | 只看该作者
程天宇 发表于 2020-5-2 10:36
我想问下,为什么它不会自动翻页呢?是需要另外的设置吗,我爬完之后只有第一页的内容 ...

使用哪个工具?关键词搜索吗?有没有预先在集搜客浏览器中登录微博
举报 使用道具
1089#
LAREMEMBER__ 初级会员 发表于 2020-5-11 12:20:18 | 只看该作者
本帖最后由 LAREMEMBER__ 于 2020-5-11 12:22 编辑

额 为啥我的任务旁边显示“已采集”但是数据打包不了呢C:\Users\orange stars\Pictures\批注 2020-05-11 121926
举报 使用道具
1090#
Fuller 管理员 发表于 2020-5-11 12:25:56 | 只看该作者
LAREMEMBER__ 发表于 2020-5-11 12:20
额 为啥我的任务旁边显示“已采集”但是数据打包不了呢

再等几分钟看看,也可以重新刷新一下微博工具箱的页面,也许是登录状态失效了
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-8 10:17