本人刚刚开始学习gooseeker进行抓取数据,请问有什么快捷的方式直接抓取某个网站中所有链接的URL地址,以及其生成的GET和POST请求呢,请问gooseeker是否有能实现这样的功能。谢谢!
举报 使用道具
| 回复

共 1 个关于本帖的回复 最后回复于 2016-8-10 09:34

沙发
Fuller 管理员 发表于 2016-8-10 09:34:25 | 只看该作者
1,抓取URL这个活动,在GooSeeker这里称为抓 爬虫线索。在MS谋数台的 爬虫路线工作台上定义规则。要爬取所有url,特别容易,使用“样式线索”,比如,你只想爬虫 http://news.ifeng.com 网站的网址,其它广告或者指向其它网站的不要,那么样式就填写 http://news.ifeng.com

2,GooSeeker不分GET和POST,一样的处理方法,所以你不用管哪类请求

万一POST发出以后弹出一个新窗口,那么就得用飞掠模式。

所有这些教程都在教程首页可以找到,可以输入关键词进行搜索:http://www.gooseeker.com/tuto/tutorial.html
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-26 16:22