11#
759924607 高级会员 发表于 2016-9-21 14:28:19 | 只看该作者
Fuller 发表于 2016-9-21 09:39
网址是什么?如果选项有独立网址,就不用做那么麻烦的抓取规则,用个普通二级抓取就行了 ...

Fuller大神,对一个标签,我只做简单的样例复制,也是有问题的。其实还是刚刚的Xpath的问题,Xpath约束不够,导致不能准确定位。
做内容抓取,一个是内容映射,再一个是加定位标志了。这两个完全不够,还得高级设置加Xpath路径。
您能看看这个具体怎么写吗?父节点一样,没有区分。


举报 使用道具
12#
Fuller 管理员 发表于 2016-9-21 15:23:56 | 只看该作者
759924607 发表于 2016-9-21 14:28
Fuller大神,对一个标签,我只做简单的样例复制,也是有问题的。其实还是刚刚的Xpath的问题,Xpath约束不 ...

要用最前面的类别名作为xpath中的标志,类似
  1. //div[contains(span/text(), '公司')]/ul/li....
复制代码
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 话题分析(NMF模型和LDA模型)软件的安装和
  • 运行Apple无法验证的程序的方法
  • 文本聚类分析软件的安装和使用方法
  • 利用AI阅读和分析文本:扣子COZE记录用户反
  • 在网页片段内直观标注——以B站评论采集为

热门用户

GMT+8, 2025-3-14 05:39