|
如果不做手工指定的定位映射,那么爬虫软件会根据设定的“偏好id”或者“偏好class”自动找一个,是从最近的一个祖先DOM节点上找。
如果class或者id中含有唯一性的数字,比如,第一行内容的class是 xxx_1,第二行是 xxx_2,那么自动选用这个class的话就不合适,就只能采集到这一条数据。
这个时候,就可以手工指定一个定位标志,避开自动选择的这个不合适的标志。
点击“测试”按钮以后,除了看采集结果以外,可以点击“采集规则”tab,看生成的xpath,这是一个XSLT文件,如果能理解这个编程语言的话,可以帮助找出规则的问题,主要看生成的xpath,是否选用了不合适的class或者id
|
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有帐号?立即注册
x
|
共 3 个关于本帖的回复 最后回复于 2022-8-12 10:17