快捷导航
问题描述:采集任务进行修改(新增采集字段),没有修改原有字段内容,新增字段与原有字段独立关系,但是:执行后,新增采集字段采集结果正确,原有的字段却采集错误。
举报 使用道具
| 回复

共 7 个关于本帖的回复 最后回复于 2022-12-17 17:44

Fuller 管理员 发表于 2022-12-16 16:50:09 | 显示全部楼层
把规则名字发出来我们分析一下
举报 使用道具
Fuller 管理员 发表于 2022-12-16 16:52:33 | 显示全部楼层
新增字段以后,整个整理箱的定位规则就变化了。如果以前的抓取内容使用了自定义xpath,就会受到影响。还有一种可能,如果没有手工做定位标志映射,如果整理箱的定位规则发生改变,可能会影响到抓取内容自动选择的定位标志
举报 使用道具
tesla0078 中级会员 发表于 2022-12-16 17:19:22 | 显示全部楼层
Fuller 发表于 2022-12-16 16:52
新增字段以后,整个整理箱的定位规则就变化了。如果以前的抓取内容使用了自定义xpath,就会受到影响。还有 ...

是的。原有字段有用到自定义xpath(非自定义的满足不了需求)。这种要怎么解决呢
举报 使用道具
tesla0078 中级会员 发表于 2022-12-16 17:29:15 | 显示全部楼层
Fuller 发表于 2022-12-16 16:50
把规则名字发出来我们分析一下

关键词搜索页面构建店铺Prolist02
举报 使用道具
Fuller 管理员 发表于 2022-12-16 18:18:01 | 显示全部楼层
tesla0078 发表于 2022-12-16 17:29
关键词搜索页面构建店铺Prolist02

我加载了这个规则,发现运行的很好。

如果抓取内容有自定义xpath,因为自定义xpath的开头是这样写的 ./xxxx,表示相对于整个整理箱的定位。一旦增加一个抓取内容,整理箱的定位就变了,原先的相对点就错误了,必须重新修改自定义xpath。

如下图,上面红框是整个整理箱的xpath,下面红框是整理箱中其中一个抓取内容的xpath。要检查抓取内容的xpath是否跟整理箱的能够配合的上。

自定义定位规则.png
举报 使用道具
tesla0078 中级会员 发表于 2022-12-16 18:20:43 | 显示全部楼层
Fuller 发表于 2022-12-16 18:18
我加载了这个规则,发现运行的很好。

如果抓取内容有自定义xpath,因为自定义xpath的开头是这样写的 ./x ...

运行没问题,但第二个字段内容是错的。
举报 使用道具
Fuller 管理员 发表于 2022-12-17 17:44:12 | 显示全部楼层
tesla0078 发表于 2022-12-16 18:20
运行没问题,但第二个字段内容是错的。

内容表达式那里可以用concat函数,定位表达式那里不能用,因为定位表达式一定要定位到一个dom节点才行
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 对共词关系求协方差矩阵后再用Girvan-Newma
  • 社区发现算法Girvan-Newman(GN)是否能应用
  • 使用GooSeeker分词和Gephi进行中文文本分析
  • Gephi社会网络分析-网络图的统计
  • 范文:亚运短视频对杭州城市形象的建构研究

热门用户

GMT+8, 2023-2-2 09:41