本帖最后由 hehanbo 于 2017-11-18 10:33 编辑

要爬去某个博主的所有Po文,我积分不够(要爬的数据几千条),所以只能尝试自己写。

但是我处理不好先下拉-再翻页这个动作。

请各位大大能否提点一二?

有没有比较好的实例供参考?

爬去某个博主的所有Po文。
举报 使用道具
| 回复

共 1 个关于本帖的回复 最后回复于 2017-11-18 08:57

沙发
Fuller 管理员 发表于 2017-11-18 08:57:23 | 只看该作者
需要定义两个主题
1,在第一个主题中,定义下拉菜单动作,目标主题指向第二个主题
2,在第二个主题中,抓取内容,并翻页

那么,集搜客爬虫就能自动形成一个循环: 主题1选第1个菜单-》主题2抓内容-》主题2翻页,翻页,翻页,结束 -》主题1选第2个菜单-》主题2抓内容-》主题2翻页,翻页......

可以参看更复杂的选日历过程
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-20 22:17