如图,这个页面上有65张图片以及相关数据,我做了样例复制以后,采集时却只采集到了5条。
同时,相同结构的其他页面,有的能够全部采集下来。
而有的甚至不出结果,如下图,一直在抓取中,这是为什么,怎么办?



刚接触爬数据,望多多指教,求助求助
举报 使用道具
| 回复

共 2 个关于本帖的回复 最后回复于 2016-5-28 11:59

沙发
summous 新手上路 发表于 2016-5-28 11:41:23 | 只看该作者
举报 使用道具
板凳
Fuller 管理员 发表于 2016-5-28 11:59:01 | 只看该作者
要连续滚屏才行,这是个长瀑布流网页。瀑布流网页有两种
1,滚不到底的
2,能滚到底的。
如果不能滚到底的,要用连续动作中的滚屏,滚两下抓一次,因为这类网页,滚到下面的话,上面的可能就删除了。不过这个网页可能不是这样。
如果能滚到底,只要打开DS打数机的滚屏参数就行,用菜单 配置-〉滚屏参数。
这些使用技巧都在教程页上,要么看左边的目录,要么搜索:http://www.gooseeker.com/tuto/tutorial.html

你抓到太少的原因是屏幕太小,是不是笔记本?要往下滚屏才能抓更多。另外,要把DS打数机设置成全屏模式,可以把下面的日志输出窗口都不要(拉那个分解线,往下拉)
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-27 04:38