二级网页抓取用单搜还是集搜?用集搜是否能加快速度?一级还没有抓完的时候是否可以启动二级?
举报 使用道具
| 回复

共 1 个关于本帖的回复 最后回复于 2016-10-3 12:31

沙发
Fuller 管理员 发表于 2016-10-3 12:31:59 | 只看该作者
单搜:就是在当前DS打数机窗口中运行爬虫,所以,只能有一个规则在运行
集搜:会弹出一个新的DS打数机窗口,在抓取规则列表中一共有20个抓取规则,每一行都对应一个集搜窗口,所以,总共能运行20个窗口。他们并行抓取,速度就提高了。

第一级没有完成也可以运行第二级,如果已经有些线索了,那么就会正常运行,如果一个线索也没有,就会终止。运行顺序上,一级和二级没有约束关系,主要看当时有没有线索
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-26 10:18