采集需要登陆的网站，数据是json格式的，怎么采集？

xandy

如题。

Fuller · 发表于 2015-12-16 16:29:57

JSON是 JavaScript Object Notation的首字母缩写，参看百度百科词条：http://baike.baidu.com/view/136475.htm
所谓Object，就是一种结构化格式，我们通常要解决网页的半结构化内容向结构化的转换，GooSeeker网络爬虫和其他类似的网页采集器都是为这个目的开发出来的，一旦变成结构化，就能像操作数据库一样处理网络信息。既然JSON就是结构化的，其实就没有必要用网页采集器进行转换了。

假设存储数据不用关系数据库，而是用NoSQL，像Mongodb的数据表达方式就是JSON，直接入库。

采集需要登陆的网站，数据是json格式的，怎么采集？

共 1 个关于本帖的回复最后回复于 2015-12-16 16:29

推荐板块

精彩推荐

热门话题

热门用户

	B Color Image Link Quote Code Smilies 高级模式您需要登录后才可以回帖登录 \| 立即注册回帖并转播回帖后跳转到最后一页

采集需要登陆的网站，数据是json格式的，怎么采集？

共 1 个关于本帖的回复 最后回复于 2015-12-16 16:29

推荐板块

精彩推荐

热门话题

热门用户

共 1 个关于本帖的回复最后回复于 2015-12-16 16:29