10 25227

主题:来评曲线

yxjun1984 于 2019-4-30 17:26 发表 [复制链接]
提示: 作者被禁止或删除 内容自动屏蔽
举报 使用道具
| 回复

共 10 个关于本帖的回复 最后回复于 2019-4-30 18:00

Fuller 管理员 发表于 2019-4-30 17:36:43 | 显示全部楼层
偏好clas20190430173548.png
首先,不要用绝对定位,而是用偏好class,这样采集到的内容很好
举报 使用道具
yxjun1984 禁止发言 发表于 2019-4-30 17:40:04 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
举报 使用道具
Fuller 管理员 发表于 2019-4-30 17:41:02 | 显示全部楼层
翻页20190430173930.png

翻页规则也是:
1,不要用绝对定位,而是用偏好class
2,选择记号线索,>>就是翻页记号
3,在做翻页记号映射之前,先不要勾选“文本记号”,这样就可以把BUTTON的@class属性作为记号做映射
举报 使用道具
Fuller 管理员 发表于 2019-4-30 17:41:51 | 显示全部楼层
我这样修改以后,翻页和抓取都没有问题。

但是,有一个问题:评论级别不好抓
举报 使用道具
yxjun1984 禁止发言 发表于 2019-4-30 17:49:39 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
举报 使用道具
Fuller 管理员 发表于 2019-4-30 17:50:52 | 显示全部楼层
5个xing20190430174849.png

总是5个星,但是有时候是灰的,那么class值就不含有active。上图是其中一个抓取方案,这个字段做高级设置,抓取“网页片段”,这样就会把class值抓下来,等处理结果的时候,这个字段特殊处理一下,数数几个active
举报 使用道具
Fuller 管理员 发表于 2019-4-30 17:51:46 | 显示全部楼层
yxjun1984 发表于 2019-4-30 17:49
还是不行啊,这是为何呢?

DS打数机菜单 配置-》滚屏参数,把滚屏次数设置成2,只要>0,就会滚屏,如果不滚屏,评论好像不显示
举报 使用道具
yxjun1984 禁止发言 发表于 2019-4-30 17:58:13 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
举报 使用道具
Fuller 管理员 发表于 2019-4-30 17:58:49 | 显示全部楼层
xing20190430175631.png
也可以这样抓取星。定义一个嵌套的整理箱。这样有几个active的星就抓几个。注意上面显示的定位标志映射和内容映射。用定位标志映射可以抓取多实例,就像样例复制一样。
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-28 21:39