本帖最后由 keymanleon 于 2017-4-21 14:30 编辑

刚才按照教程已经把目标网站的1000多页抓取下来了,我现在准备用爬虫群来把1000多xml转为一个excel。

我本来打算直接在会员中心转的,不过在转的过程中一直说我的客户端版本不在8.0.3以上,我就放弃了。

后来找到以下教程(http://www.gooseeker.com/doc/article-200-1.html),说要先运行爬虫群。

可是我的打数机菜单里面根本没有这个选项!


请问我需要怎样才能完成XML到excel的转换??

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
| 回复

共 12 个关于本帖的回复 最后回复于 2017-4-21 16:02

沙发
scraper 论坛元老 发表于 2017-4-21 14:30:40 | 只看该作者
你是点错地方了吧 xml转excel不会有这个提示
你看下面这个教程看看怎么转吧
http://www.gooseeker.com/doc/article-329-1.html
举报 使用道具
板凳
keymanleon 新手上路 发表于 2017-4-21 14:35:58 | 只看该作者
scraper 发表于 2017-4-21 14:30
你是点错地方了吧 xml转excel不会有这个提示
你看下面这个教程看看怎么转吧
http://www.gooseeker.com/doc/ ...

请问是一定要压缩成zip吗?
rar可以不?

举报 使用道具
地板
scraper 论坛元老 发表于 2017-4-21 14:36:28 | 只看该作者
keymanleon 发表于 2017-4-21 14:35
请问是一定要压缩成zip吗?
rar可以不?

不可以 只支持zip

举报 使用道具
5#
keymanleon 新手上路 发表于 2017-4-21 14:52:39 | 只看该作者
scraper 发表于 2017-4-21 14:36
不可以 只支持zip

其实我刚才是按照教程去弄的。
http://www.gooseeker.com/doc/article-259-1.html

操作到运行爬虫群的时候就说我客户端版本不是8.0.3以上,我就弄不下去了。

后来看其他帖子,说这是个bug。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
6#
scraper 论坛元老 发表于 2017-4-21 14:55:40 | 只看该作者
keymanleon 发表于 2017-4-21 14:52
其实我刚才是按照教程去弄的。
http://www.gooseeker.com/doc/article-259-1.html

你已经有结果文件了
为什么还要去运行爬虫群

举报 使用道具
7#
scraper 论坛元老 发表于 2017-4-21 14:57:11 | 只看该作者

看方式1

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
8#
keymanleon 新手上路 发表于 2017-4-21 14:57:38 | 只看该作者
scraper 发表于 2017-4-21 14:55
你已经有结果文件了
为什么还要去运行爬虫群

不是要用爬虫群来将xml转化成excel吗???

我现在手上有1000个xml,我需要转化成一个excel。
求指点。
PS:刚才已经按你的说法把1000个xml打包成zip了
举报 使用道具
9#
scraper 论坛元老 发表于 2017-4-21 15:06:15 | 只看该作者
keymanleon 发表于 2017-4-21 14:57
不是要用爬虫群来将xml转化成excel吗???

我现在手上有1000个xml,我需要转化成一个excel。

认真看教程去吧

举报 使用道具
10#
scraper 论坛元老 发表于 2017-4-21 15:07:13 | 只看该作者
keymanleon 发表于 2017-4-21 14:57
不是要用爬虫群来将xml转化成excel吗???

我现在手上有1000个xml,我需要转化成一个excel。

爬虫群是可以边采集边上传到数据库
你现在已经采集完了 只需要导入数据库就可以了
所以不需要运行爬虫群

举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 运行Apple无法验证的程序的方法
  • 文本聚类分析软件的安装和使用方法
  • 利用AI阅读和分析文本:扣子COZE记录用户反
  • 在网页片段内直观标注——以B站评论采集为
  • 利用AI阅读和分析文本:使用COZE建设游记文

热门用户

GMT+8, 2024-12-23 07:35