想要爬取猫眼电影的票房,第一个是票房爬出来是乱码,然后翻页一出来是从全部算起的,但是没办法再翻到2018年 2017年了,求教大神帮忙


举报 使用道具
| 回复

共 9 个关于本帖的回复 最后回复于 2021-3-27 10:14

沙发
fengmo 新手上路 发表于 2018-8-8 16:45:36 | 只看该作者
猫眼首页

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
板凳
Fuller 管理员 发表于 2018-8-8 17:49:42 | 只看该作者
这个网站上的乱码是因为自定义字体造成的,我们在vip版上将提供自定义字体的破解功能
举报 使用道具
地板
fengmo 新手上路 发表于 2018-8-8 21:45:40 | 只看该作者
Fuller 发表于 2018-8-8 17:49
这个网站上的乱码是因为自定义字体造成的,我们在vip版上将提供自定义字体的破解功能 ...

谢谢谢谢,那请问大神,那这个的翻页要怎么处理呢,
举报 使用道具
5#
Fuller 管理员 发表于 2018-8-9 09:25:26 | 只看该作者
fengmo 发表于 2018-8-8 21:45
谢谢谢谢,那请问大神,那这个的翻页要怎么处理呢,

一般这种对应每个年份都有独立网址,这样的话,手工把这一个网址拷贝出来,添加线索就行了。不用做翻页规则。

如果没有独立网址,应该使用连续动作中的连续点击,参看:https://www.gooseeker.com/doc/article-288-1.html

其他连续动作教程都在高级教程版块:https://www.gooseeker.com/tuto/tutorial.html
举报 使用道具
6#
305896098 新手上路 发表于 2021-3-26 12:23:46 | 只看该作者
请问猫眼电影网页版只能看到10条评论,要怎么样才能显示全部评论
举报 使用道具
7#
scraper 论坛元老 发表于 2021-3-26 15:08:31 | 只看该作者
305896098 发表于 2021-3-26 12:23
请问猫眼电影网页版只能看到10条评论,要怎么样才能显示全部评论

采集只能采集网页上公开显示的内容
举报 使用道具
8#
305896098 新手上路 发表于 2021-3-26 16:11:43 | 只看该作者
scraper 发表于 2021-3-26 15:08
采集只能采集网页上公开显示的内容

请问爬微博评论时候,用户昵称和评论内容怎么分开啊。
举报 使用道具
9#
王建国 高级会员 发表于 2021-3-26 16:53:24 | 只看该作者
你在用微博评论工具采集吗?
微博评论工具默认就是昵称和评论内容是拆分的:https://www.gooseeker.com/land/weibo.html
举报 使用道具
10#
305896098 新手上路 发表于 2021-3-27 10:14:58 | 只看该作者
王建国 发表于 2021-3-26 16:53
你在用微博评论工具采集吗?
微博评论工具默认就是昵称和评论内容是拆分的:https://www.gooseeker.com/lan ...

如果要自己写规则,怎么把昵称和评论内容分开呀
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 利用AI阅读和分析文本:扣子COZE记录用户反
  • 在网页片段内直观标注——以B站评论采集为
  • 利用AI阅读和分析文本:使用COZE建设游记文
  • 使用AI工具Kimi生成python代码为文本分析结
  • 苹果mac电脑安装集搜客网络爬虫软件失败的

热门用户

GMT+8, 2024-12-4 01:29