下面看到的是旧版操作界面,新版操作请看《xml转为Excel》。 登录集搜客官网,点击右上角的用户名进入会员中心,在规则管理中点击某个主题,进入到管理页面就可以做操作,具体有以下两种方式: 方式1:设置结果入库并用爬虫群采数据,就能导出excel数据 操作:进入会员中心->规则管理,点击对应的主题名进入管理页面,点击“调度”按钮,勾上“结果入库”并确认,然后运行爬虫群采数据,等采完数据后就回到主题的管理页面,点击“导出数据”。在“历史记录”里可以查看导出记录以及重复下载。 注意:必须使用爬虫群窗口进行采集,才会自动导入数据,点击单搜/集搜/MS上的爬数据按钮弹出的爬虫窗口不受调度参数控制。 爬虫群是一种本地采集模式,采到的xml文件还是存在本地电脑的DataScraperworks文件夹中,想要采到的数据自动入库,都要勾上“结果入库”,这样每采完一轮线索数量都会自动把xml文件打包成zip,一次最大导入20M的zip数据包,超过的话就会导入失败,入库成功后就把xml文件转移到imported文件夹里。 【注意】没有数据导出,请检查爬虫是否采完一轮线索(默认是一轮20条线索)、xml是否自动打包为zip;如果没有自动打包的话可以手工打包xml并上传,操作看方式2。 方式2:手工导入数据,用爬虫群采集但没有设置结果入库或者是点击单搜/集搜/MS上的爬数据按钮弹出的窗口采数据的,都可以通过这种方式来转excel。 操作:把主题名文件夹里中的xml文件打包为zip,然后进入会员中心->规则管理->点击对应主题进入管理页面,再点击“导入数据”,一次最大导入10M的zip数据包,提示成功后就能导出数据,并且在“历史记录”里可以重复下载数据包。 【注意】数据管理功能是增值服务,可以免费导出1万条数据/个规则,超额请购买“专业版or旗舰版爬虫”或“数据仓库”来扩大储存量后再继续导出数据,或购买“仓库清扫”清理旧数据后再来存储新数据。 |