采集网址是:http://www.zj.gov.cn/art/2018/1/12/art_1229278037_2309113.html
因为索引号、主题分类是用tr、th、td来写的只能用xpath定位
然后用以下xpath查找了下,能找到(两个)元素:
//th[contains(text(),"索引号")]/following::td[1]
然后写入定义xpath,测试用了索引号和主体分类两个字段
但采集结果是索引号和主题分类采集到的的都是索引号“002482170/2018-768274”的值,请问问题出在哪里?
|
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有帐号?立即注册
x
|
|
|
|
共 5 个关于本帖的回复 最后回复于 2022-1-6 16:44