本帖最后由 Mu_shui_GS2020 于 2020-3-30 23:43 编辑

主题名叫:新豆瓣电影数据分析-短评
希望大家能帮一下忙,谢谢了

问题:只能采集一种星级信息,其他的星级信息在测试后发现采集位置都是空的

如图

如图
举报 使用道具
| 回复

共 4 个关于本帖的回复 最后回复于 2020-3-31 11:06

Fuller 管理员 发表于 2020-3-31 00:03:01 | 显示全部楼层
加载你的规则失败了,从提示信息看,不同星级都有不同的class,如果规则使用了5星级的class,那么只能抓取5星级的。我看看怎样修改

规则20200331000140.png
举报 使用道具
Fuller 管理员 发表于 2020-3-31 00:07:32 | 显示全部楼层
内容20200331000458.png

用最下面那个箭头指向的节点做内容映射,用倒数第二个箭头指向的节点做定位标志映射,就能跳过@class='allstar40 rating'。其他内容也可以用上定位标志映射,提高规则的适应性。定位标志映射的教程是:《定位标志映射精确采集范围
举报 使用道具
Mu_shui_GS2020 初级会员 发表于 2020-3-31 11:00:58 | 显示全部楼层
好的,谢谢你,捂脸,我还没没试过运行,之前只是测试,汗,我去试一下,谢谢你
举报 使用道具
Mu_shui_GS2020 初级会员 发表于 2020-3-31 11:06:26 | 显示全部楼层
Fuller 发表于 2020-3-31 00:07
用最下面那个箭头指向的节点做内容映射,用倒数第二个箭头指向的节点做定位标志映射,就能跳过@class='al ...

真的谢谢你,已经可以了
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-29 04:10