采集数据只有十几Kb时没问题,是正常的。然后数据量稍微大一点就没有格式了,全部都是内容,也不分段,十分混乱,这是为什么啊。

G%%[6}1O4QWDPBWF4V}~UH6.png (750.92 KB, 下载次数: 942)

G%%[6}1O4QWDPBWF4V}~UH6.png
举报 使用道具
| 回复

共 5 个关于本帖的回复 最后回复于 2021-4-29 17:09

沙发
Fuller 管理员 发表于 2019-6-7 17:09:33 | 只看该作者
主题名是什么?
举报 使用道具
板凳
15028289888 新手上路 发表于 2019-6-8 08:29:36 | 只看该作者
Fuller 发表于 2019-6-7 17:09
主题名是什么?

主题名是这个。

]4LIAD~ZP3KE9DL]8S3L07E.png (63.27 KB, 下载次数: 907)

]4LIAD~ZP3KE9DL]8S3L07E.png
举报 使用道具
地板
Fuller 管理员 发表于 2019-6-8 09:36:05 | 只看该作者
如果在抓取内容中设置了网页片段,那么用浏览器打开采集结果的时候会解析网页片段,所以你看到的就没有格式了。如果你用文本编辑器打开,格式还在
举报 使用道具
5#
17634025839 新手上路 发表于 2021-4-29 17:09:09 | 只看该作者
怎么下载呢,求
举报 使用道具
6#
17634025839 新手上路 发表于 2021-4-29 17:09:26 | 只看该作者
Fuller 发表于 2019-6-8 09:36
如果在抓取内容中设置了网页片段,那么用浏览器打开采集结果的时候会解析网页片段,所以你看到的就没有格式 ...

怎么下载呢

举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-25 02:20