11#
bowieD 金牌会员 发表于 2017-11-22 16:08:57 | 只看该作者
胡越晟 发表于 2017-11-22 16:01
2仔细讲下,谢谢,给下教程
瀑布截取不完是啥原因

1,把采集速度放慢一点,可以采集完的。
2,第二种方法可以看下这个教程《层级采集》

举报 使用道具
12#
胡越晟 新手上路 发表于 2017-11-22 16:44:54 | 只看该作者
bowieD 发表于 2017-11-22 16:08
1,把采集速度放慢一点,可以采集完的。
2,第二种方法可以看下这个教程《层级采集》

又看了下 既没全采完 也没全点开

举报 使用道具
13#
umsung 高级会员 发表于 2017-11-22 16:50:23 | 只看该作者
胡越晟 发表于 2017-11-22 16:44
又看了下 既没全采完 也没全点开

那就用第二种方法
举报 使用道具
14#
胡越晟 新手上路 发表于 2017-11-22 17:45:25 | 只看该作者
umsung 发表于 2017-11-22 16:50
那就用第二种方法

问题是知乎不是第二级的啊 我只是截取点开的完整文字啊

举报 使用道具
15#
umsung 高级会员 发表于 2017-11-22 17:53:53 | 只看该作者
胡越晟 发表于 2017-11-22 17:45
问题是知乎不是第二级的啊 我只是截取点开的完整文字啊

在第二级详情页里,文字都是完整展开的,可以直接在详情页里采集到完整的文字,就不需要用连续点击动作。
举报 使用道具
16#
胡越晟 新手上路 发表于 2017-11-22 17:59:32 | 只看该作者
umsung 发表于 2017-11-22 17:53
在第二级详情页里,文字都是完整展开的,可以直接在详情页里采集到完整的文字,就不需要用连续点击动作。 ...

好吧 其次我看了下采集过程貌似是滑倒一定程度又翻回去了 然后采集完成 实际没采完

举报 使用道具
17#
umsung 高级会员 发表于 2017-11-22 18:16:36 | 只看该作者
胡越晟 发表于 2017-11-22 17:59
好吧 其次我看了下采集过程貌似是滑倒一定程度又翻回去了 然后采集完成 实际没采完

...

如果能用层级采集采集的话就尽量用层级采集,连续动作和很多因素有关,容易出错。并不是一下翻回去了,是往下滚屏了,把延迟抓取和超时时超的参数调大一些,在DS打数机-》配置中设置。
举报 使用道具
18#
胡越晟 新手上路 发表于 2017-11-23 11:28:03 | 只看该作者
umsung 发表于 2017-11-22 18:16
如果能用层级采集采集的话就尽量用层级采集,连续动作和很多因素有关,容易出错。并不是一下翻回去了,是 ...

当前页面的某个脚本正忙,或者可能已停止响应。您可以立即终止该脚本,也可以继续等待该脚本完成。

脚本: https://static.zhihu.com/heife…vendor.72d10fe31301a0517a94.js:1
举报 使用道具
19#
胡越晟 新手上路 发表于 2017-11-23 19:44:27 | 只看该作者
umsung 发表于 2017-11-22 18:16
如果能用层级采集采集的话就尽量用层级采集,连续动作和很多因素有关,容易出错。并不是一下翻回去了,是 ...

一层采集好了 为什么二层只采集一页
举报 使用道具
20#
胡越晟 新手上路 发表于 2017-11-23 20:02:46 | 只看该作者
胡越晟 发表于 2017-11-23 19:44
一层采集好了 为什么二层只采集一页

超时啥情况
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-14 16:03