DOM树显示的是 BR #text BR #text BR #text BR #text 我采用的是分层提取,首先是帖子标题的界面,然后再点进去内容,就是想把每个帖子的内容都扒下来,但是现在他每个text是一个段落,这该怎么办呢?因为不同的帖子,他的段落应该也是不一样的,无法给定啊。 能否指教下~
为信息属性设置block特性,可以抓取html片段,或者只抓取文字。
恩,我使用了, 然后他出来这三个错误: error1: XPaths for base and replica have different steps error2:Invalid repBranch for base replica error3: The length of data extraction instruction file is zero. Skipped 能否告知这三个错误一般是什么意思? 谢谢啦!!
抓取多实例的样例复制品映射要求两个样例在平行的DOM分支上,而且两个节点应该在同一级
使用block特性
为信息属性设置block特性,可以抓取html片段,或者只抓取文字。
我使用了block,但是出来三个错误,请问是什么意思呀?
恩,我使用了,
然后他出来这三个错误:
error1: XPaths for base and replica have different steps
error2:Invalid repBranch for base replica
error3: The length of data extraction instruction file is zero. Skipped
能否告知这三个错误一般是什么意思?
谢谢啦!!
抓取多实例
抓取多实例的样例复制品映射要求两个样例在平行的DOM分支上,而且两个节点应该在同一级