|
用第一条内容生成规则,可以看到xpath中给A节点加了一个position()限定
再看第一条数据的DOM,可以看到第一条有两个A,爬虫生成规则的时候,遇到有多个相同节点的时候,就要限定一下。
为了避免这种情况发生,要么采用自定义xpath,在自定义xpath中把[position() = 2]删除。
还有一个方法:给抓取内容做上定位映射,给整理箱也做上定位映射,而不用样例映射,这样就可以选用第二条数据作为样例定义规则,第二条没有两个A,就不会出现问题。
|
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有帐号?立即注册
x
|
共 7 个关于本帖的回复 最后回复于 2022-2-22 13:48