本帖最后由 Anna J 于 2015-12-22 11:57 编辑
不管是新人还是资深用户,爬虫爬取下来的xml格式数据的转换,都是一个难以忽视的坎。对新手而言,还要用热心用户的工具,需要费一番功夫;对高级用户来说,xml量一大就还是很难实现快速转换。
为了解决这个问题,集搜客最近新推出的爬虫群功能之“数据管理”——可以实现xml导入云仓库,然后根据自己的格式需求导出数据。整个过程将比之前的各种处理办法速度快很多。
并且“激活入库”的功能可以直接实现自定义建表,实现采集数据更符合需求的导出。 更多关于“爬虫群”请见http://www.gooseeker.com/doc/article-200-1.html
|
|
|
|
|
共 13 个关于本帖的回复 最后回复于 2016-5-11 10:05