快捷导航

通过会员中心把xml转为excel

2016-5-9 17:34| 发布者: ym| 查看: 5762| 评论: 3

摘要: 登录集搜客官网,进入会员中心,通过爬虫管理的规则管理或数据管理就可以转excel格式,具体有以下三种方式: 方式1:通过爬虫群采集并设置自动入库,就能导出excel数据。 操作:通过爬虫管理-规则管理,点击主题名进 ...

登录集搜客官网,点击右上角的用户名进入会员中心,在规则管理中点击某个主题,进入到管理页面就可以做操作,具体有以下两种方式:

方式1:设置结果入库并用爬虫群采数据,就能导出excel数据

操作:进入会员中心->规则管理,点击对应的主题名进入管理页面,点击“调度”按钮,勾上“结果入库”并确认,然后运行爬虫群采数据,等采完数据后就回到主题的管理页面,点击“导出数据”。在“历史记录”里可以查看导出记录以及重复下载。

注意:必须使用爬虫群窗口进行采集,才会自动导入数据,点击单搜/集搜/MS上的爬数据按钮弹出的爬虫窗口不受调度参数控制。

爬虫群是一种本地采集模式,采到的xml文件还是存在本地电脑的DataScraperworks文件夹中,想要采到的数据自动入库,都要勾上“结果入库”,这样每采完一轮线索数量都会自动把xml文件打包成zip,一次最大导入20M的zip数据包,超过的话就会导入失败,入库成功后就把xml文件转移到imported文件夹里。

【注意】没有数据导出,请检查爬虫是否采完一轮线索(默认是一轮20条线索)、xml是否自动打包为zip;如果没有自动打包的话可以手工打包xml并上传,操作看方式2。


方式2:手工导入数据,用爬虫群采集但没有设置结果入库或者是点击单搜/集搜/MS上的爬数据按钮弹出的窗口采数据的,都可以通过这种方式来转excel。

操作:把主题名文件夹里中的xml文件打包为zip,然后进入会员中心->规则管理->点击对应主题进入管理页面,再点击“导入数据”,一次最大导入10M的zip数据包,提示成功后就能导出数据,并且在“历史记录”里可以重复下载数据包。

【注意】数据管理功能是增值服务,可以免费导出1万条数据/个规则,超额请购买“专业版or旗舰版爬虫”或“数据仓库”来扩大储存量后再继续导出数据,或购买“仓库清扫清理旧数据后再来存储新数据。


若有疑问可以集搜客网络爬虫
6

鲜花

握手

雷人

路过

鸡蛋

刚表态过的朋友 (6 人)

相关阅读

发表评论

最新评论

评论 gz51837844 2017-5-4 12:17
_Wu_yy: 请问能不能批量处理呀?
文中介绍的2种方法都支持批量处理
评论 _Wu_yy 2017-5-4 12:03
请问能不能批量处理呀?
评论 elegantcoin 2016-9-5 10:20
哈哈哈 用过的都说好

查看全部评论(3)

集搜客GooSeeker网络爬虫 ( 粤ICP备11065265号-2 )

GMT+8, 2017-9-25 12:25