如题,抓取评论星级,抓取下来得星级每页都是一样的星级,但是如果单个抓取又是正确的,用了自定义的Xpath路径://div[contains(@class,'grade-star')]/@class         
求大神支招啊!!十分感谢!!!
举报 使用道具
| 回复

共 4 个关于本帖的回复 最后回复于 2016-11-10 21:24

沙发
Fuller 管理员 发表于 2016-4-11 10:25:32 | 只看该作者
自定义的时候,不要用 // 双斜杠开头,双斜杠是全局匹配,GooSeeker要求定义一个整理箱,也就是可以先划定一个范围,然后在这个范围内定位每个抓取内容。这样就会很准确地定位。所以,自定义xpath一般开头用 ./(或者直接标签名), .// ,是参照整理箱的定位点开始往下写xpath,具体可以参看:http://www.gooseeker.com/doc/article-248-1.html
举报 使用道具
板凳
cherrylf 初级会员 发表于 2016-4-12 10:25:18 | 只看该作者
好嘞,,哈哈,,十分感谢哈,,
举报 使用道具
地板
987654321 初级会员 发表于 2016-11-10 21:12:29 | 只看该作者
Fuller 发表于 2016-4-11 10:25
自定义的时候,不要用 // 双斜杠开头,双斜杠是全局匹配,GooSeeker要求定义一个整理箱,也就是可以先划定 ...

如果不用xpath怎么解决

举报 使用道具
5#
Fuller 管理员 发表于 2016-11-10 21:24:52 | 只看该作者
987654321 发表于 2016-11-10 21:12
如果不用xpath怎么解决

一定要用自定义XPath
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-28 20:24