|
如果要做结果合并,最好入到数据库,比如MySQL或者MongoDB
gs_extractor输出成XML,因为抓取规则是一个输出成XML的脚本程序,目前不直接输出json,需要做一个转换,比如,入MongoDB之前肯定要转换成json。这个转换可以很直接
结果里面的<item>应该对应成[],里面是整理箱实例对象。就变成 [{}, {}, {}, ...., {}]这样子。这样变换的话,入MongoDB最合适,如果用市面上现成的转换工具,会把<item>当成一项内容,变成json后,就把对象结构搞得不好了,在MongoDB中搜索子集就失效了 |
|
共 6 个关于本帖的回复 最后回复于 2016-8-12 16:48