11#
jesscia_2020 高级会员 发表于 2021-9-26 13:13:27 | 只看该作者
不是您的这个规则,是:企业信息查询结果 这个规则,测试的时候当前页面信息采集不全;另外您说的每个用xpath也没看懂
举报 使用道具
12#
gz51837844 管理员 发表于 2021-9-26 14:26:27 | 只看该作者
jesscia_2020 发表于 2021-9-26 13:13
不是您的这个规则,是:企业信息查询结果 这个规则,测试的时候当前页面信息采集不全;另外您说的每个用xpa ...

对于一些复杂页面,可以自定义xpath来定位抓取内容,实现更精准的采集
xpath教程参看《xpath基础知识培训
举报 使用道具
13#
jesscia_2020 高级会员 发表于 2021-9-27 19:51:41 | 只看该作者
是在每个字段设置处写上xpath吗
举报 使用道具
14#
gz51837844 管理员 发表于 2021-9-27 22:16:47 | 只看该作者
jesscia_2020 发表于 2021-9-27 19:51
是在每个字段设置处写上xpath吗

你做好采集规则后, 点击测试, 如果发现哪个字段的测试结果和预期不符, 可以调整内容映射和定位映射,多次测试, 也可以自定义xpath
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-5 15:39