如何采集整个网页保存在本地文件成HTML文件，不要xml格式？

丁道师

如何采集整个网页保存在本地文件成HTML格式文件，不要xml格式？

15170883617 · 发表于 2019-10-30 11:52:42

本帖最后由 15170883617 于 2019-10-30 11:59 编辑

保存成html格式文件没办法做到，可以采下整个html代码，

可以把DOM中的最顶层html节点映射给抓取内容，就能把整个html存下来

Fuller · 发表于 2019-10-30 12:09:18

集搜客网络爬虫软件GooSeeker能把整个html存下来，但是是放在采集结果文件xml中的，如果只想要html，需要把XML文件中的包围html的那些标签都删除。

集搜客gsbrowser新版网络爬虫软件具有专门的下载html快照的功能，要等一段时间才能正式发布这个版本

共 2 个关于本帖的回复最后回复于 2019-10-30 12:09

	B Color Image Link Quote Code Smilies 高级模式您需要登录后才可以回帖登录 \| 立即注册回帖并转播回帖后跳转到最后一页