11#
zhangzhengzao 新手上路 发表于 2018-12-3 14:22:27 | 只看该作者
1.您好,按照您的方法,在第七页的DOM节点上,用右键菜单重新做内容映射。然后点击测试,会弹出提示“两个样例的Xpath表达式的路径长度不一样,为第一个样例计算定位表达式失败,映射给两个样例的应该是具有相同父节点的兄弟节点”,我觉得可能是因为我默认用的还是第一页时候设置的样例复制,所以在第七页上重新设置样例复制。不知是否正确?

2.在第七页上重新建立的规则保存后,马上弹出“映射给记号的节点没有包容在映射给线索的节点内部”。请问这是否是需要在第七页重新设置翻页区和翻页记号?但是如果重新设置翻页后,爬数据时在第一页就会因为无法翻页而死掉,应该怎么处理?
3.另外,DS打数机在从第一页开始爬数据时好像会直接使用第七页保存好的那个规则,然后就会匹配失败。
请问在保存好两个规则以后,如何让系统在不同页面自动调用合适的规则呢?
举报 使用道具
12#
Fuller 管理员 发表于 2018-12-3 15:38:16 | 只看该作者
zhangzhengzao 发表于 2018-12-3 14:22
1.您好,按照您的方法,在第七页的DOM节点上,用右键菜单重新做内容映射。然后点击测试,会弹出提示“两个 ...

加载了规则以后,用来分析第七页的内容,可能有些分析成功了,有些失败了。这样的话,在上面再次做映射,可能会有冲突。为了解决这些冲突,可以选中整理箱上的抓取内容,点击鼠标右键,有清除内容映射的菜单。

DS打数机在运行的时候,会选择第一个可以成功匹配的规则。如果看到匹配失败,说明另个规则都失效了
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-20 20:49