用不了微博搜索抓取工具
举报 使用道具
| 回复

共 6 个关于本帖的回复 最后回复于 2021-7-4 18:16

沙发
Fuller 管理员 发表于 2021-7-4 07:04:10 | 只看该作者
微博评论是没有翻页的,是瀑布流模式的,爬虫会自动滚屏。如果采集失败了,要检查一下你的微博是不是旧版微博,这套采集工具只采集旧版微博,要切换到旧版,操作方法看这个帖子:https://www.gooseeker.com/doc/thread-18757-1-1.html
举报 使用道具
板凳
taekookv 新手上路 发表于 2021-7-4 10:08:00 | 只看该作者
Fuller 发表于 2021-7-4 07:04
微博评论是没有翻页的,是瀑布流模式的,爬虫会自动滚屏。如果采集失败了,要检查一下你的微博是不是旧版微 ...

是旧版微博呀 但是它都不会自动滚屏 要设置什么吗
举报 使用道具
地板
Fuller 管理员 发表于 2021-7-4 13:29:22 | 只看该作者
taekookv 发表于 2021-7-4 10:08
是旧版微博呀 但是它都不会自动滚屏 要设置什么吗

如果用的是快捷采集或者微博采集工具箱,而不是自己定义的采集规则,那么就不用做什么设置,自动滚屏都设置好了。
有没有开vpn或者360杀毒软件之类的?这些都会让网络变得很慢。

也可以贴出来一个微博网址,我测试一下试试
举报 使用道具
5#
taekookv 新手上路 发表于 2021-7-4 14:24:44 | 只看该作者
Fuller 发表于 2021-7-4 13:29
如果用的是快捷采集或者微博采集工具箱,而不是自己定义的采集规则,那么就不用做什么设置,自动滚屏都设 ...

是自己定义的规则
因为没有足够的积分数据导不出来
https://weibo.com/1887790981/Kek1lDtpB?type=repost#_rnd1625366206314
麻烦你帮我看下谢谢
举报 使用道具
6#
Fuller 管理员 发表于 2021-7-4 18:12:32 | 只看该作者
taekookv 发表于 2021-7-4 14:24
是自己定义的规则
因为没有足够的积分数据导不出来
https://weibo.com/1887790981/Kek1lDtpB?type=repost ...

你的规则名字是什么?我可以加载你的规则看看。

因为评论信息是瀑布流的,要用连续动作的滚屏,在规则里面要定义连续滚屏动作,参看这篇教程:《自动滚屏采集瀑布流网页—以今日头条新闻为例
举报 使用道具
7#
Fuller 管理员 发表于 2021-7-4 18:16:19 | 只看该作者
taekookv 发表于 2021-7-4 14:24
是自己定义的规则
因为没有足够的积分数据导不出来
https://weibo.com/1887790981/Kek1lDtpB?type=repost ...

微博的页面有些复杂,所以,我们专门给用户做了微博采集工具箱。如果采集量比较大的话,可以购买旗舰版,不限量下载数据。这样比较省事,也比较实惠。这是微博采集工具箱的入口:https://www.gooseeker.com/land/weibo.html
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-7 11:02