问题描述:采集任务进行修改(新增采集字段),没有修改原有字段内容,新增字段与原有字段独立关系,但是:执行后,新增采集字段采集结果正确,原有的字段却采集错误。
举报 使用道具
| 回复

共 7 个关于本帖的回复 最后回复于 2022-12-17 17:44

沙发
Fuller 管理员 发表于 2022-12-16 16:50:09 | 只看该作者
把规则名字发出来我们分析一下
举报 使用道具
板凳
Fuller 管理员 发表于 2022-12-16 16:52:33 | 只看该作者
新增字段以后,整个整理箱的定位规则就变化了。如果以前的抓取内容使用了自定义xpath,就会受到影响。还有一种可能,如果没有手工做定位标志映射,如果整理箱的定位规则发生改变,可能会影响到抓取内容自动选择的定位标志
举报 使用道具
地板
tesla0078 高级会员 发表于 2022-12-16 17:19:22 | 只看该作者
Fuller 发表于 2022-12-16 16:52
新增字段以后,整个整理箱的定位规则就变化了。如果以前的抓取内容使用了自定义xpath,就会受到影响。还有 ...

是的。原有字段有用到自定义xpath(非自定义的满足不了需求)。这种要怎么解决呢
举报 使用道具
5#
tesla0078 高级会员 发表于 2022-12-16 17:29:15 | 只看该作者
Fuller 发表于 2022-12-16 16:50
把规则名字发出来我们分析一下

关键词搜索页面构建店铺Prolist02
举报 使用道具
6#
Fuller 管理员 发表于 2022-12-16 18:18:01 | 只看该作者
tesla0078 发表于 2022-12-16 17:29
关键词搜索页面构建店铺Prolist02

我加载了这个规则,发现运行的很好。

如果抓取内容有自定义xpath,因为自定义xpath的开头是这样写的 ./xxxx,表示相对于整个整理箱的定位。一旦增加一个抓取内容,整理箱的定位就变了,原先的相对点就错误了,必须重新修改自定义xpath。

如下图,上面红框是整个整理箱的xpath,下面红框是整理箱中其中一个抓取内容的xpath。要检查抓取内容的xpath是否跟整理箱的能够配合的上。


举报 使用道具
7#
tesla0078 高级会员 发表于 2022-12-16 18:20:43 | 只看该作者
Fuller 发表于 2022-12-16 18:18
我加载了这个规则,发现运行的很好。

如果抓取内容有自定义xpath,因为自定义xpath的开头是这样写的 ./x ...

运行没问题,但第二个字段内容是错的。
举报 使用道具
8#
Fuller 管理员 发表于 2022-12-17 17:44:12 | 只看该作者
tesla0078 发表于 2022-12-16 18:20
运行没问题,但第二个字段内容是错的。

内容表达式那里可以用concat函数,定位表达式那里不能用,因为定位表达式一定要定位到一个dom节点才行
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-19 20:12