xpath如何抓取一个节点之后兄弟节点的内容

fqzlala

大概是这个意思
div
p
h1
p
p
p
我想抓取h1之后所有p节点的内容。

xandy · 发表于 2017-3-3 10:40:00

主题名或样本网址发下

fqzlala · 发表于 2017-3-3 10:40:41

xandy 发表于 2017-3-3 10:40
主题名或样本网址发下

https://www.csis.org/analysis/effect-encryption-lawful-access-communications-and-data

fqzlala · 发表于 2017-3-3 10:41:52

xandy 发表于 2017-3-3 10:40
主题名或样本网址发下

用这个吧
https://www.csis.org/analysis/issues-insights-vol-17-no-2-back-basics-conference-report-us-rok-japan-trilateral-strategic
这个p节点多一些

ym · 发表于 2017-3-3 10:41:59

要自定义xpath，你看看这篇《xpath常用函数用法》，自己选择合适的函数来试试吧

fqzlala · 发表于 2017-3-3 10:43:57

我其实想取第二个P节点之后的所有的p节点内容，因为第一个是日期，后面才是正文

ym · 发表于 2017-3-3 10:50:39

用substring-after()函数比较合适

fqzlala · 发表于 2017-3-3 10:56:51

ym 发表于 2017-3-3 10:50
用substring-after()函数比较合适

好的，谢谢

xandy · 发表于 2017-3-3 11:33:51

fqzlala 发表于 2017-3-3 10:43
我其实想取第二个P节点之后的所有的p节点内容，因为第一个是日期，后面才是正文 ...

用following-sibling函数比较适合，因为正文部分并不是特定文本前或者是特定文本后的内容，如下图所示：
下面这个xpath语句的意思是提取class为“subtitle”的节点后的第二个以上的兄弟P节点，也就是文章的正文部分。

复制代码

然后该采集字段高级设置里头要勾选网页片段，而不是勾选文本内容。
更多xpath的语法自己去了解：《自定义xpath》

共 8 个关于本帖的回复最后回复于 2017-3-3 11:33

	B Color Image Link Quote Code Smilies 高级模式您需要登录后才可以回帖登录 \| 立即注册回帖并转播回帖后跳转到最后一页