doc转htm,假如单独抓一份数据是ok,但是数量多就不好,规则不好鉴定,容易抓错内容,抓空,所以contains()函数是最常用的,根据文本中的标志文字定位节点
我把文件放到了百度云盘里了http://pan.baidu.com/s/1ctg34E
规则不管怎么写都是不行,能不能详细指导一下我呢?
我用这个规则
规则一
//*[contains(./td//span/text(),'质式')][1]/td[2] 是能定位,就没有办法精确定位那个位置
规则二
- //*[@class='MsoNormal'][contains(.//text(),'质式')]/../following-sibling::td[2]
完全定位不到
帮我看一下@xandy
|
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有帐号?立即注册
x
|
|
|
|
共 5 个关于本帖的回复 最后回复于 2017-3-13 11:39