1231#
Fuller 管理员 发表于 2021-3-3 09:32:50 | 只看该作者
itroyslb 发表于 2021-3-3 09:11
为什么不能爬取展开全文的内容呢?

含有“展开全文”的微博网址要过滤出来,添加到另外一个快捷采集工具中,专门展开采集全文,是这个 微博博文展开全部采集
举报 使用道具
1232#
scraper 论坛元老 发表于 2021-3-3 09:34:43 | 只看该作者
itroyslb 发表于 2021-3-3 09:11
为什么不能爬取展开全文的内容呢?

可以爬微博展开全文,用快捷采集上的微博博文展开全部采集工具对博文进行筛选,将包含展开全文内容的博文独立网址,添加到微博博文展开全部采集工具
具体可以参考这个帖子的置顶回答:https://www.gooseeker.com/doc/thread-11134-1-1.html
举报 使用道具
1233#
xinzhe 初级会员 发表于 2021-3-9 10:02:28 | 只看该作者
你好 可以爬取是否是认证用户吗
举报 使用道具
1234#
scraper 论坛元老 发表于 2021-3-9 10:29:42 | 只看该作者
xinzhe 发表于 2021-3-9 10:02
你好 可以爬取是否是认证用户吗

可以用这个快捷采集来爬:https://www.gooseeker.com/res/da ... 7%E9%87%87%E9%9B%86
举报 使用道具
1235#
15754307820 初级会员 发表于 2021-3-10 23:46:40 | 只看该作者
请问为什么采集状态显示“已采集”,但是打包的时候显示“无可打包的数据”?
举报 使用道具
1236#
wangyong 版主 发表于 2021-3-11 09:21:19 | 只看该作者
15754307820 发表于 2021-3-10 23:46
请问为什么采集状态显示“已采集”,但是打包的时候显示“无可打包的数据”? ...


在用什么采集工具,看看数据下载中有没有可下载的数据包

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
1237#
jinjinliu 新手上路 发表于 2021-3-12 18:57:22 | 只看该作者
请问采集的数据太多了可以只选择下载一部分吗?
举报 使用道具
1238#
Fuller 管理员 发表于 2021-3-12 18:59:01 | 只看该作者
jinjinliu 发表于 2021-3-12 18:57
请问采集的数据太多了可以只选择下载一部分吗?

没有这个选项。如果采集量比较大,购买旗舰版比较合适,旗舰版购买以后,下载数据不用扣积分
举报 使用道具
1239#
yangsong 新手上路 发表于 2021-3-13 23:13:50 | 只看该作者
关键词过滤没有呢
举报 使用道具
1240#
maomao 论坛元老 发表于 2021-3-14 17:50:00 | 只看该作者
yangsong 发表于 2021-3-13 23:13
关键词过滤没有呢

具体是指什么,过滤什么的关键词?
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 话题分析(NMF模型和LDA模型)软件的安装和
  • 运行Apple无法验证的程序的方法
  • 文本聚类分析软件的安装和使用方法
  • 利用AI阅读和分析文本:扣子COZE记录用户反
  • 在网页片段内直观标注——以B站评论采集为

热门用户

GMT+8, 2025-2-6 05:50