9 9189

猫眼电影翻页问题

fengmo 于 2018-8-8 16:44 发表 [复制链接]

想要爬取猫眼电影的票房,第一个是票房爬出来是乱码,然后翻页一出来是从全部算起的,但是没办法再翻到2018年 2017年了,求教大神帮忙


举报 使用道具
| 回复

共 9 个关于本帖的回复 最后回复于 2021-3-27 10:14

fengmo 新手上路 发表于 2018-8-8 16:45:36 | 显示全部楼层
猫眼首页

1533717737(1).png
举报 使用道具
Fuller 管理员 发表于 2018-8-8 17:49:42 | 显示全部楼层
这个网站上的乱码是因为自定义字体造成的,我们在vip版上将提供自定义字体的破解功能
举报 使用道具
fengmo 新手上路 发表于 2018-8-8 21:45:40 | 显示全部楼层
Fuller 发表于 2018-8-8 17:49
这个网站上的乱码是因为自定义字体造成的,我们在vip版上将提供自定义字体的破解功能 ...

谢谢谢谢,那请问大神,那这个的翻页要怎么处理呢,
举报 使用道具
Fuller 管理员 发表于 2018-8-9 09:25:26 | 显示全部楼层
fengmo 发表于 2018-8-8 21:45
谢谢谢谢,那请问大神,那这个的翻页要怎么处理呢,

一般这种对应每个年份都有独立网址,这样的话,手工把这一个网址拷贝出来,添加线索就行了。不用做翻页规则。

如果没有独立网址,应该使用连续动作中的连续点击,参看:https://www.gooseeker.com/doc/article-288-1.html

其他连续动作教程都在高级教程版块:https://www.gooseeker.com/tuto/tutorial.html
举报 使用道具
305896098 新手上路 发表于 2021-3-26 12:23:46 | 显示全部楼层
请问猫眼电影网页版只能看到10条评论,要怎么样才能显示全部评论
举报 使用道具
scraper 论坛元老 发表于 2021-3-26 15:08:31 | 显示全部楼层
305896098 发表于 2021-3-26 12:23
请问猫眼电影网页版只能看到10条评论,要怎么样才能显示全部评论

采集只能采集网页上公开显示的内容
举报 使用道具
305896098 新手上路 发表于 2021-3-26 16:11:43 | 显示全部楼层
scraper 发表于 2021-3-26 15:08
采集只能采集网页上公开显示的内容

请问爬微博评论时候,用户昵称和评论内容怎么分开啊。
举报 使用道具
王建国 高级会员 发表于 2021-3-26 16:53:24 | 显示全部楼层
你在用微博评论工具采集吗?
微博评论工具默认就是昵称和评论内容是拆分的:https://www.gooseeker.com/land/weibo.html
举报 使用道具
305896098 新手上路 发表于 2021-3-27 10:14:58 | 显示全部楼层
王建国 发表于 2021-3-26 16:53
你在用微博评论工具采集吗?
微博评论工具默认就是昵称和评论内容是拆分的:https://www.gooseeker.com/lan ...

如果要自己写规则,怎么把昵称和评论内容分开呀
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-29 23:54