快捷导航
有时候爬下来的xml文件显示不正常,具体是什么原因呢?

QQ浏览器截图20190107141107.png
9ACC3726-2C07-42e2-B318-83B3F082315D.png
举报 使用道具
| 回复

共 2 个关于本帖的回复 最后回复于 2019-1-7 17:32

Fuller 管理员 发表于 2019-1-7 14:54:19 | 显示全部楼层
这是因为勾选了网页片段,那么抓取下来的内容含有html内容,用浏览器打开html的时候,展示的效果就不一样。你可以用文本编辑器打开看看就知道抓取网页片段有什么不同了
举报 使用道具
稀饭客 高级会员 发表于 2019-1-7 17:32:00 | 显示全部楼层
哦哦,谢谢,确实勾了网页片段,估计是编辑xpath的时候勾错了
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 调度设置参数说明
  • 集搜客网络爬虫软件实现自动网页截屏
  • 怎样使用搜狐新闻搜索列表快捷工具抓取关键
  • 用于清洗文本内容的Excel函数公式
  • 用网络爬虫采集小红书的笔记

热门用户

集搜客GooSeeker网络爬虫 ( 粤ICP备11065265号-2 )

GMT+8, 2019-6-24 20:37