你们那个方法挺好用的,能使用phomtanJS迅速定位到ajax生成的页面元素,其它基于http流的都不行
但是抓去玩的数据都是xml的,想变成通用的数据怎么处理呢?

举报 使用道具
| 回复

共 6 个关于本帖的回复 最后回复于 2017-9-24 18:13

沙发
shengchengx 金牌会员 发表于 2017-8-22 16:20:33 | 只看该作者
《xml转换为excel 》可以看下这个教程,会有讲怎么讲xml文件转换成Excel、

举报 使用道具
板凳
zhujun6538 新手上路 发表于 2017-8-22 17:54:26 | 只看该作者
shengchengx 发表于 2017-8-22 16:20
《xml转换为excel 》可以看下这个教程,会有讲怎么讲xml文件转换成Excel、

只提示数据导入失败
举报 使用道具
地板
Fuller 管理员 发表于 2017-8-22 18:13:28 | 只看该作者
zhujun6538 发表于 2017-8-22 17:54
只提示数据导入失败

现在还没有导入成功吗?要把结果文件压缩成zip格式的,不能是rar或者其他格式,而且只能包含纯文件,不要包含文件夹
举报 使用道具
5#
zhujun6538 新手上路 发表于 2017-8-22 18:24:00 | 只看该作者
Fuller 发表于 2017-8-22 18:13
现在还没有导入成功吗?要把结果文件压缩成zip格式的,不能是rar或者其他格式,而且只能包含纯文件,不要 ...

可以了,要加入一串另外的xml,如下:
<extraction><clueid>411641559</clueid><fullpath><![CDATA[http://data.eastmoney.com/report/000001.html]]></fullpath><realpath><![CDATA[http://data.eastmoney.com/report/000001.html]]></realpath><theme>eastmoneytest</theme><middle>规则_1</middle><createdate>2017-8-22 18:3:17</createdate><pageno>0</pageno><actionno></actionno><actionvalue></actionvalue><prestamp>DSEngine-+--+-0</prestamp><currentstamp>DSEngine-+-ds_browser_top-+-157643667</currentstamp><baseURI><bucketBaseURI><bucketName>data</bucketName><uri><![CDATA[http://data.eastmoney.com/report/000001.html]]></uri></bucketBaseURI></baseURI>
举报 使用道具
6#
Fuller 管理员 发表于 2017-8-22 21:08:13 | 只看该作者
zhujun6538 发表于 2017-8-22 18:24
可以了,要加入一串另外的xml,如下:
411641559eastmoneytest规则_12017-8-22 18:3:170DSEngine-+--+-0D ...

这串内容是自动生成的,为什么要另外加入?你修改过结果文件?
举报 使用道具
7#
012006024431 初级会员 发表于 2017-9-24 18:13:26 | 只看该作者
python编写一个小程序可一次性把xml文件转成TXT或者cvs
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 运行Apple无法验证的程序的方法
  • 文本聚类分析软件的安装和使用方法
  • 利用AI阅读和分析文本:扣子COZE记录用户反
  • 在网页片段内直观标注——以B站评论采集为
  • 利用AI阅读和分析文本:使用COZE建设游记文

热门用户

GMT+8, 2024-12-24 11:05