我用抓包工具看了,点击一个按钮,发送post消息,显示的网页内容怎样采集?
举报 使用道具
| 回复

共 1 个关于本帖的回复 最后回复于 2016-10-5 11:03

Fuller 管理员 发表于 2016-10-5 11:03:11 | 显示全部楼层
GooSeeker网络爬虫做模拟点击抓取的时候是不区分Get还是Post的,分别考虑这些情形:
1)如果是模拟点击操作,比如提交一个form表单,定义规则的时候设置连贯抓取,无论Get还是post,都一样
2)如果是层级抓取,上级规则为下级生成线索的时候,如果看到是post 提交表单,是生成不了下级线索的,所以,层级抓取不能用于post
3)如果点击以后,显示的内容是在弹出窗口中,而不是在当前浏览器窗口中,那么要用飞掠模式抓取,具体参看:http://www.gooseeker.com/doc/thread-3260-1-1.html
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-29 04:31