微博资料爬取规则名为规则001
主要是想爬取媒体相关数据
但是定义好规则、表等之后测试是正常的
点击保存和采数据之后就会显示采集失败。。
有没有大佬知道是哪一步错了呀
急着交作业。。
image.png
image.png


image.png
举报 使用道具
| 回复

共 6 个关于本帖的回复 最后回复于 2021-12-8 12:35

wangyong 版主 发表于 2021-12-8 09:56:05 | 显示全部楼层
问题是因为没有做样例复制,做完样例复制再执行抓取,参考教程:https://www.gooseeker.com/doc/article-520-1.html
采集微博关键词数据一般都不自己做规则,直接用微博工具箱中的微博关键词搜索采集工具:https://www.gooseeker.com/res/softdetail_4.html
举报 使用道具
00aqliu 新手上路 发表于 2021-12-8 10:50:20 | 显示全部楼层
wangyong 发表于 2021-12-8 09:56
问题是因为没有做样例复制,做完样例复制再执行抓取,参考教程:https://www.gooseeker.com/doc/article-52 ...

做完样例复制之后,依旧一条数据都出不来“采集失败”。。。。。。
举报 使用道具
00aqliu 新手上路 发表于 2021-12-8 10:51:10 | 显示全部楼层
wangyong 发表于 2021-12-8 09:56
问题是因为没有做样例复制,做完样例复制再执行抓取,参考教程:https://www.gooseeker.com/doc/article-52 ...

尝试过微博采集箱的。。也失败了
举报 使用道具
Fuller 管理员 发表于 2021-12-8 11:31:13 | 显示全部楼层
00aqliu 发表于 2021-12-8 10:51
尝试过微博采集箱的。。也失败了

我测试了你的规则,运行很正常。

1,要在爬虫浏览器中预先登录微博
2,爬虫运行的时候,不要缩小窗口
举报 使用道具
00aqliu 新手上路 发表于 2021-12-8 12:13:45 | 显示全部楼层
Fuller 发表于 2021-12-8 11:31
我测试了你的规则,运行很正常。

1,要在爬虫浏览器中预先登录微博

是不是我集搜客的下载少了什么插件之类的,反复错哇,微博是登陆的,爬虫运行的时候我连鼠标都不敢动。还是采不出来,导出来的Excel能发给我吗?
举报 使用道具
00aqliu 新手上路 发表于 2021-12-8 12:35:03 | 显示全部楼层
Fuller 发表于 2021-12-8 11:31
我测试了你的规则,运行很正常。

1,要在爬虫浏览器中预先登录微博

有没有可能是我集搜客的打开方式不对,两点都满足,但是依旧。。。。。。如果可以导出的话,能直接将Excel发给我嘛?
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-29 20:47