如何抓取多个页面的数据?原网页是有下一页的那种。
我是小白,刚刚接触,谢谢!
举报 使用道具
| 回复

共 3 个关于本帖的回复 最后回复于 2016-3-24 12:41

沙发
wavexiao 初级会员 发表于 2016-3-24 11:19:05 | 只看该作者
看到了


小白求助翻页抓取问题
zyx0911 于 前天 22:43 发表 最后回复 昨天 13:12

先看教程吧,谢谢管理员!
举报 使用道具
板凳
Fuller 管理员 发表于 2016-3-24 12:16:54 | 只看该作者
翻页操作既常见,也不像想象的那么容易,因为网页会有一些奇怪的结构,影响到翻页的有效性,这里有一组文章:http://www.gooseeker.com/doc/thread-698-1-1.html

最关键是解决一个问题:DS打数机 点击 “下一页”标志的时候能点准,通常做了规则,当前页可能可以,翻到下一页就不行了。
最重要的是观察生成的翻页规则xpath,一般来说越短越有适应性。看上面那组文章,就会知道怎样调整参数,让xpath尽量短
举报 使用道具
地板
wavexiao 初级会员 发表于 2016-3-24 12:41:31 | 只看该作者
谢谢,看了你的几篇文章,现阶段的问题都解决了!谢谢大神!
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-27 07:21