961#
Fuller 管理员 发表于 2019-11-13 17:39:59 | 只看该作者
lalaxiaoer 发表于 2019-11-13 16:02
爬到的数据里博主发的内容如果比较多就会显示展开全文,而不是全部内容,这个怎么解决呀 ...

这里有个现成的快捷采集工具,需要进入到每篇博文,爬虫会自动点击展开全文:https://www.gooseeker.com/res/datadiy.html?category=%E7%A4%BE%E4%BA%A4&web=%E6%96%B0%E6%B5%AA%E5%BE%AE%E5%8D%9A&rule=%E5%BE%AE%E5%8D%9A%E5%8D%9A%E6%96%87%E5%B1%95%E5%BC%80%E5%85%A8%E9%83%A8%E9%87%87%E9%9B%86
举报 使用道具
962#
养猩猩的猪 初级会员 发表于 2019-11-24 22:24:00 | 只看该作者
您好,我想问微博全文过长,如何设置在爬虫的时候自动展开全文呢?
举报 使用道具
963#
养猩猩的猪 初级会员 发表于 2019-11-24 22:58:33 | 只看该作者
为什么我选择展开全文的爬虫    就一直显示错误   不能继续爬了呢
举报 使用道具
964#
Fuller 管理员 发表于 2019-11-24 23:43:37 | 只看该作者
养猩猩的猪 发表于 2019-11-24 22:58
为什么我选择展开全文的爬虫    就一直显示错误   不能继续爬了呢

我安排人检查一下这个爬虫规则
举报 使用道具
965#
wangyong 版主 发表于 2019-11-25 09:33:18 | 只看该作者
养猩猩的猪 发表于 2019-11-24 22:58
为什么我选择展开全文的爬虫    就一直显示错误   不能继续爬了呢

我们检查到微博展开全文的快捷采集没有问题

采集展开全文的数据是需要添加微博的独立网址:https://weibo.com/1737737970/Fz7dw8A8u?refer_flag=1001030103_&type=comment#_rnd1574645520243

先采集关键词搜索列表,然后从关键词搜索列表中筛选出要展开全文的微博,再进行采集
举报 使用道具
966#
maomao 论坛元老 发表于 2019-11-25 09:37:54 | 只看该作者
养猩猩的猪 发表于 2019-11-24 22:24
您好,我想问微博全文过长,如何设置在爬虫的时候自动展开全文呢?

爬关键词得到的excel数据表中,有一列是博文独立网址。把博文独立网址批量复制添加到博文展开工具



本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
967#
养猩猩的猪 初级会员 发表于 2019-11-27 17:56:26 | 只看该作者
maomao 发表于 2019-11-25 09:37
爬关键词得到的excel数据表中,有一列是博文独立网址。把博文独立网址批量复制添加到博文展开工具。

谢谢
举报 使用道具
968#
leijiah 新手上路 发表于 2019-12-1 20:32:47 | 只看该作者
博主主页链接是那个复制的链接吗?为什么我粘贴后还不可以?
举报 使用道具
969#
Fuller 管理员 发表于 2019-12-1 21:37:15 | 只看该作者
leijiah 发表于 2019-12-1 20:32
博主主页链接是那个复制的链接吗?为什么我粘贴后还不可以?

看到这样的内容的时候,就是博主的主页


本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
970#
1154706230 初级会员 发表于 2019-12-2 12:06:51 | 只看该作者
为什么我抓微博评论只能抓到一页啊?我想抓一条微博的所有评论怎么抓呀?
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 运行Apple无法验证的程序的方法
  • 文本聚类分析软件的安装和使用方法
  • 利用AI阅读和分析文本:扣子COZE记录用户反
  • 在网页片段内直观标注——以B站评论采集为
  • 利用AI阅读和分析文本:使用COZE建设游记文

热门用户

GMT+8, 2024-12-21 06:12