https://www.ele.me/place/wtw3sjqm6g7
饿了么这种不停点击加载更多商家,怎么处理好呀

举报 使用道具
| 回复

共 3 个关于本帖的回复 最后回复于 2016-11-11 09:43

沙发
xandy 论坛元老 发表于 2016-11-10 14:49:19 | 只看该作者
这个网页是要点击后才会加载更多商家,我们可以用连续动作,第一个规则做点击,第二个规则采集点击后的商家信息,要注意的是,每抓一次会产生一次结果,这样的话,最后一次的结果就是最全的结果。连续动作的教程可以看这里:《连续动作让爬虫持续采集数据
举报 使用道具
板凳
Fuller 管理员 发表于 2016-11-10 21:57:29 | 只看该作者
xandy 发表于 2016-11-10 14:49
这个网页是要点击后才会加载更多商家,我们可以用连续动作,第一个规则做点击,第二个规则采集点击后的商家 ...

因为一个网页上只需点击一次,所以,可以不用连续动作,连续动作一般是用来在网页上连续做很多动作,毕竟连续动作规则定义起来麻烦一些。

这个跟翻页的原理完全一样,“点击加载更多商家”跟翻页的“下一页”完全一样的作用,所以,做个翻页规则就可以了。
举报 使用道具
地板
xandy 论坛元老 发表于 2016-11-11 09:43:37 | 只看该作者
Fuller 发表于 2016-11-10 21:57
因为一个网页上只需点击一次,所以,可以不用连续动作,连续动作一般是用来在网页上连续做很多动作,毕竟 ...

这个点一次还不能看到全部,要一直点
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-26 04:48