11#
759924607 高级会员 发表于 2016-9-21 14:28:19 | 只看该作者
Fuller 发表于 2016-9-21 09:39
网址是什么?如果选项有独立网址,就不用做那么麻烦的抓取规则,用个普通二级抓取就行了 ...

Fuller大神,对一个标签,我只做简单的样例复制,也是有问题的。其实还是刚刚的Xpath的问题,Xpath约束不够,导致不能准确定位。
做内容抓取,一个是内容映射,再一个是加定位标志了。这两个完全不够,还得高级设置加Xpath路径。
您能看看这个具体怎么写吗?父节点一样,没有区分。


举报 使用道具
12#
Fuller 管理员 发表于 2016-9-21 15:23:56 | 只看该作者
759924607 发表于 2016-9-21 14:28
Fuller大神,对一个标签,我只做简单的样例复制,也是有问题的。其实还是刚刚的Xpath的问题,Xpath约束不 ...

要用最前面的类别名作为xpath中的标志,类似
  1. //div[contains(span/text(), '公司')]/ul/li....
复制代码
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-7 00:32