本人刚刚开始学习gooseeker进行抓取数据,请问有什么快捷的方式直接抓取某个网站中所有链接的URL地址,以及其生成的GET和POST请求呢,请问gooseeker是否有能实现这样的功能。谢谢!
举报 使用道具
| 回复

共 1 个关于本帖的回复 最后回复于 2016-8-10 09:34

沙发
Fuller 管理员 发表于 2016-8-10 09:34:25 | 只看该作者
1,抓取URL这个活动,在GooSeeker这里称为抓 爬虫线索。在MS谋数台的 爬虫路线工作台上定义规则。要爬取所有url,特别容易,使用“样式线索”,比如,你只想爬虫 http://news.ifeng.com 网站的网址,其它广告或者指向其它网站的不要,那么样式就填写 http://news.ifeng.com

2,GooSeeker不分GET和POST,一样的处理方法,所以你不用管哪类请求

万一POST发出以后弹出一个新窗口,那么就得用飞掠模式。

所有这些教程都在教程首页可以找到,可以输入关键词进行搜索:http://www.gooseeker.com/tuto/tutorial.html
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 话题分析(NMF模型和LDA模型)软件的安装和
  • 运行Apple无法验证的程序的方法
  • 文本聚类分析软件的安装和使用方法
  • 利用AI阅读和分析文本:扣子COZE记录用户反
  • 在网页片段内直观标注——以B站评论采集为

热门用户

GMT+8, 2025-2-6 19:23