11#
xandy 论坛元老 发表于 2017-6-6 09:56:04 | 只看该作者
hblemon2008 发表于 2017-6-6 09:36
因为从A至H每一类的采集量都很大,不分类采集的话,首先有可能数据漏采集,另外采集的速度会随着采集量的增 ...

你的规则连续动作中只设置了一个点击动作,这个动作只会点击第一级分类,如果你想要让爬虫继续点击第二级分类,那就多做一个点击动作,同理,想要越深入就相应的增加点击动作
举报 使用道具
12#
hblemon2008 高级会员 发表于 2017-6-6 10:04:56 | 只看该作者
事前无法确定总共会有多少层级,有的有很多级,有的只有一、两级,这该如何做呢?
举报 使用道具
13#
wangyong 版主 发表于 2017-6-6 10:49:39 | 只看该作者
每级要点开都要做一条连续动作
举报 使用道具
14#
xandy 论坛元老 发表于 2017-6-6 11:43:46 | 只看该作者
hblemon2008 发表于 2017-6-6 10:04
事前无法确定总共会有多少层级,有的有很多级,有的只有一、两级,这该如何做呢? ...

建议采集“外观分类查询”页签下的内容,这下面只需要设置1个点击动作就可以全部展开了

举报 使用道具
15#
hblemon2008 高级会员 发表于 2017-6-6 18:13:55 | 只看该作者
xandy 发表于 2017-6-6 11:43
建议采集“外观分类查询”页签下的内容,这下面只需要设置1个点击动作就可以全部展开了

...

不能用“外观分类查询”,“IPC分类”是一个标准,谢谢!

举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-8 11:07