翻页查询的时候,第一页的内容能查询得到,但是从第二页开始,就不能查到数据了,采用了绝对定位也不行。出现问题的主题名为“层级抓取_东方财富股吧_帖子页面”,求大神指点,谢谢
举报 使用道具
| 回复

共 1 个关于本帖的回复 最后回复于 2016-3-18 22:21

Fuller 管理员 发表于 2016-3-18 22:21:22 | 显示全部楼层
几个明显的问题
1,至少要把一个抓取内容勾上“关键内容”,否则就没有正确性判断标准了
2,不能用绝对定位,股吧这样的网站,中间插了很多广告,很容易影响规则的适应性。除了不能用绝对定位,还应该用上定位标志,提高适应性。参看:http://www.gooseeker.com/doc/thread-707-1-1.html
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-29 08:09