网站地址:https://www.bilibili.com/bangumi/play/ss27845?t=3
账号已经登陆了,但还是失败

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
| 回复

共 7 个关于本帖的回复 最后回复于 2022-2-15 20:19

沙发
wangyong 版主 发表于 2022-2-14 15:07:56 | 只看该作者
这种结构的页面之前不支持采集,现在加上了,可以重新采集了:https://www.gooseeker.com/res/rule_646.html
举报 使用道具
板凳
Tricks 新手上路 发表于 2022-2-14 20:48:55 | 只看该作者
wangyong 发表于 2022-2-14 15:07
这种结构的页面之前不支持采集,现在加上了,可以重新采集了:https://www.gooseeker.com/res/rule_646.htm ...

感谢!
举报 使用道具
地板
Tricks 新手上路 发表于 2022-2-15 09:40:33 | 只看该作者
wangyong 发表于 2022-2-14 15:07
这种结构的页面之前不支持采集,现在加上了,可以重新采集了:https://www.gooseeker.com/res/rule_646.htm ...

这个评论回复有没有办法爬全啊?现在模板里面每个评论只爬最上面3条

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
5#
Fuller 管理员 发表于 2022-2-15 11:01:46 | 只看该作者
Tricks 发表于 2022-2-15 09:40
这个评论回复有没有办法爬全啊?现在模板里面每个评论只爬最上面3条

回复还没有展开之前,一般就有3条回复,就会被采集下来,后来展开了,会采集更多,你把采集到的结果用excel排序看看,把同一条评论的回复排到一起,看看有没有更多回复
举报 使用道具
6#
Tricks 新手上路 发表于 2022-2-15 14:41:45 | 只看该作者
Fuller 发表于 2022-2-15 11:01
回复还没有展开之前,一般就有3条回复,就会被采集下来,后来展开了,会采集更多,你把采集到的结果用exc ...

哦哦,可以了,不过就是会有重复的评论在里面,本来16条评论变成73条了

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
7#
Fuller 管理员 发表于 2022-2-15 15:11:09 | 只看该作者
Tricks 发表于 2022-2-15 14:41
哦哦,可以了,不过就是会有重复的评论在里面,本来16条评论变成73条了
...

这种要点击很多次的网页,都有一些重复信息,要自己剔除一下,可以在excel中把某一列中重复内容标记出来,予以删除
举报 使用道具
8#
Tricks 新手上路 发表于 2022-2-15 20:19:30 | 只看该作者
Fuller 发表于 2022-2-15 15:11
这种要点击很多次的网页,都有一些重复信息,要自己剔除一下,可以在excel中把某一列中重复内容标记出来 ...

嗯嗯
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 话题分析(NMF模型和LDA模型)软件的安装和
  • 运行Apple无法验证的程序的方法
  • 文本聚类分析软件的安装和使用方法
  • 利用AI阅读和分析文本:扣子COZE记录用户反
  • 在网页片段内直观标注——以B站评论采集为

热门用户

GMT+8, 2025-2-6 04:14