提示: 作者被禁止或删除 内容自动屏蔽
举报 使用道具
| 回复

共 5 个关于本帖的回复 最后回复于 2017-8-21 09:59

沙发
Fuller 管理员 发表于 2017-8-21 09:45:02 | 只看该作者
样例复制映射的时候,要选择第一个和第二个LI,你选择了第二个和第三个,那么就会跳一个抓一个,漏掉了一半
举报 使用道具
板凳
bowieD 金牌会员 发表于 2017-8-21 09:46:58 | 只看该作者
你做的的样例复制有问题,不是相邻的两个区块节点,所有采集信息时会才不全。
如果要全部采集下来,要选取父节点下第一个和第二个区块节点来做样例复制映射。你这里也就是分别用第一个LI节点和第二个LI节点做映射,操作请参考《样例复制》

06.jpg (150.59 KB, 下载次数: 846)

06.jpg
举报 使用道具
地板
yxjun1984 禁止发言 发表于 2017-8-21 09:48:30 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
举报 使用道具
5#
yxjun1984 禁止发言 发表于 2017-8-21 09:50:07 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
举报 使用道具
6#
bowieD 金牌会员 发表于 2017-8-21 09:59:35 | 只看该作者
本帖最后由 bowieD 于 2017-8-22 09:36 编辑
yxjun1984 发表于 2017-8-21 09:50
那请问,我追加的问题应该如何解释呢?

整理箱的抓取内容定位失败,为这种网页结构有多个相同的定位标志,再次加载就会默认选择第一个,所以要选择唯一的属性值做定位标志。
1,因为你用的class属性做标志定位,而在这里用的Class属性并不是唯一的,所有会抓取的内容会有错误,可以参考这篇文章来优化规则怎样解决规则采集失败/遗漏的问题?
2,如果你想用定位标志精确定位采集的范围,则需要网页结构中的唯一标志值给抓取内容做定位,否则
就可能会定位失败,详情参考《精准定位标志映射》

3,如果是想用定位标志实现样例复制效果,找到框住一整块信息(橙框部分)的属性节点DIV,右击做定位标志映射给整理箱,因为你这里的LI节点的class属性都是相同的,所以定位类型修改为class,就能实现样例复制。详情参考《定位标志批量采集相同定位信息》

举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-27 13:25