求教大神,抓取微博评论区的评论+互动,设立了两级规则,第一级进行连续点击展开,第二级进行抓取。
第一级规则名:于欢案6
第二级规则名:于欢案抓取6
试图抓取的其他网址:http://www.gooseeker.com/doc/for ... ewthread&fid=54

现在的问题是:连第一步点击的连续动作都没有进行就匹配失败了,但是不知道哪里出了问题。
之前发过一个帖子问了一些问题,比如1、每次修改规则都需要重新进行内容映射和样例复制,管理员建议进行定位映射,但是我做了之后,再次修改的话打开还是没有的,不知道问题出在哪里........

求大神指点。




举报 使用道具
| 回复

共 1 个关于本帖的回复 最后回复于 2017-10-9 08:47

沙发
Fuller 管理员 发表于 2017-10-9 08:47:22 | 只看该作者
抓取失败的时候,按照这篇文档分析一下失败的原因,可能是规则的适应性不够。《加载分析失败线索

第一级抓取的内容没有用,所以可以不用做很严格的关键内容校验,找个最容易抓的内容做关键内容
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-6 16:03