目标网站为携程网,需要查找经济连锁酒店的信息,因此需要把搜索范围限制在“经济连锁酒店”这一范围内。




然而不管是否点击“经济连锁酒店”,其网页地址不变。

目前我采用的是 层级搜索+翻页搜索,通过增加搜索关键字来进行拔取数据,但显得太麻烦了。 是否可以通过模拟点击或其他方式获取数据


举报 使用道具
| 回复

共 3 个关于本帖的回复 最后回复于 2016-12-23 15:52

沙发
Fuller 管理员 发表于 2016-8-8 14:56:21 | 只看该作者
定义连续动作规则,这个功能属于免费版范围。如果你有大量关键词需要输入,最好购买连发弹仓这个装备,因为免费版是把关键词放在规则中,一个规则只能包括5个关键词。而连发弹仓把关键词单独放,放多少都行,在会员中心录入或者批量导入进行
举报 使用道具
板凳
懵懵的girl 初级会员 发表于 2016-12-23 12:56:39 | 只看该作者
怎么实现呀
举报 使用道具
地板
xandy 论坛元老 发表于 2016-12-23 15:52:30 | 只看该作者

你在搜索之前,如果要先执行一串的动作,比如输入目的地,选择时间,输入关键词,或是点击经济型酒店等等,就要做连续动作。做两个规则,第一个规则让爬虫模拟你的动作,第二个规则采集搜索后的结果。
连续动作教程参看:《连续动作让爬虫持续采集数据
可以看看里头的应用场景,理解下原理。
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-6 08:32