URL在不同X详情页的位置不同改如何处理

weier_2016

亲们，我要通过搜索页面去批量抓取详情页面的URL。
但是URL的位置在不同搜索页的位置不一致。如
//*[@id="web_container"]/div/div/div/div[1]/div[3]/div[1]/div[2]/div[1]/a
//*[@id="web-container"]/div/div/div/div[1]/div[4]/div[1]/div[2]/div[1]/a
就是其中某个DIV节点的位置不一样，导致在抓取的时候部分信息抓取失败。

请问这种情况如何处理？我本来是想设置两种规则的，但是搜索页的网页结构有没有很大的差别。

yangwenge · 发表于 2018-4-12 14:36:41

有具体的链接吗？
可以试试：（1）//*[@id="web_container"]/div/div/div/div[1]/div[3]/div[1]/div[2]/div[1]/a | //*[@id="web-container"]/div/div/div/div[1]/div[4]/div[1]/div[2]/div[1]/a
（2）//*[@id="web_container"]/div/div/div/div[1]//a

weier_2016 · 发表于 2018-4-12 16:08:47

yangwenge 发表于 2018-4-12 14:36
有具体的链接吗？
可以试试：（1）//*[@id="web_container"]/div/div/div/div[1]/div[3]/div[1]/div[2]/div ...

这个是在XPATH高级配置里设置吗？

weier_2016 · 发表于 2018-4-12 16:09:09

yangwenge 发表于 2018-4-12 14:36
有具体的链接吗？
可以试试：（1）//*[@id="web_container"]/div/div/div/div[1]/div[3]/div[1]/div[2]/div ...

这个是在XPATH中配置吗

yangwenge · 发表于 2018-4-12 16:11:27

weier_2016 发表于 2018-4-12 16:09
这个是在XPATH中配置吗

在字段的高级设置->自定义xpath中，可以参考《自定义xpath》

weier_2016 · 发表于 2018-4-12 16:11:46

yangwenge 发表于 2018-4-12 16:11
在字段的高级设置中，可以参考《自定义xpath》

好的，谢谢

URL在不同X详情页的位置不同改如何处理

共 5 个关于本帖的回复最后回复于 2018-4-12 16:11

推荐板块

精彩推荐

热门话题

热门用户

	B Color Image Link Quote Code Smilies 高级模式您需要登录后才可以回帖登录 \| 立即注册回帖并转播回帖后跳转到最后一页

URL在不同X详情页的位置不同改如何处理

共 5 个关于本帖的回复 最后回复于 2018-4-12 16:11

推荐板块

精彩推荐

热门话题

热门用户

共 5 个关于本帖的回复最后回复于 2018-4-12 16:11