新手求助

huang3878221

http://www.syfc.com.cn/work/xjlp/build_list.jsp?xmmcid=62422，爬虫这个网站的数据，生成xml文件。
后来发现需要把此网址也爬到在xml文件中，有没有办法。

huang3878221 · 发表于 2018-4-27 14:19:17

查看了页面源码，没有看到h与“ttp://www.syfc.com.cn/work/xjlp/build_list.jsp?xmmcid=62422”相同的内容。

bowieD · 发表于 2018-4-27 14:20:39

采集下来的xml中的realpath字段就是当前网页的网址，这个字段是软件自带的，转成excel就知道了

huang3878221 · 发表于 2018-4-27 14:22:37

bowieD 发表于 2018-4-27 14:20
采集下来的xml中的realpath字段就是当前网页的网址，这个字段是软件自带的，转成excel就知道了 ...

疏忽疏忽，谢谢谢谢。

共 3 个关于本帖的回复最后回复于 2018-4-27 14:22

	B Color Image Link Quote Code Smilies 高级模式您需要登录后才可以回帖登录 \| 立即注册回帖并转播回帖后跳转到最后一页