我在编辑美团全聚德评论抓取时,想顺便把用户评分打星抓下来,但是发现他们的评论星级@class值不管几星都是stars-ul stars-light,根本不能转化为有效信息,判断不出分别为几星。任务名为美团北京全聚德评论抓取第三级,有大神教我怎么解决吗?
举报 使用道具
| 回复

共 2 个关于本帖的回复 最后回复于 2020-6-2 16:13

沙发
Fuller 管理员 发表于 2020-6-2 15:53:12 | 只看该作者
美团网页上,5颗星对应5个li,li元素中还有一个i元素,这个元素的class决定了这颗星是否亮。所以,要么针对ul元素做一个抓取网页片段的规则,要么针对li做一个样例复制,每颗星的class分别抓。

如果抓网页片段,数据导出以后,在excel中可以用一个公式统计一下亮的li的个数
举报 使用道具
板凳
1842554864 初级会员 发表于 2020-6-2 16:13:36 | 只看该作者
本帖最后由 1842554864 于 2020-6-2 16:17 编辑
Fuller 发表于 2020-6-2 15:53
美团网页上,5颗星对应5个li,li元素中还有一个i元素,这个元素的class决定了这颗星是否亮。所以,要么针对 ...

我试过对每一个li进行内容映射,抓取的值是空值,我更改定位于偏向id或者偏向class值都不行。网页片段我抓取到了,我先试试能不能找到计算公式算出点亮几颗星,谢谢大神啦
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 360或火绒等杀毒软件导致GooSeeker爬虫软件
  • 话题分析(NMF模型和LDA模型)软件的安装和
  • 运行Apple无法验证的程序的方法
  • 文本聚类分析软件的安装和使用方法
  • 利用AI阅读和分析文本:扣子COZE记录用户反

热门用户

GMT+8, 2025-4-22 02:12