主题名:新豆瓣电影数据分析-中国大陆
运行规则采集数据之后,进行导入时发现数据量过大无法导出,明明之前做过一次采集豆瓣电影数据不限地区的数据量也没那么大,本次加上中国大陆这一限定之后数据量却有一百多万条。于是就用xml转excel试了下,发现每一个xml文件里的数据都是上一个xml的内容加上新的数据,最后大概十个xml里的内容还都是一样的,之前没有注意,直接把所有的xml打包导入到数据管理那里,导致现在超额入库。请问,出现这种xml数据重复情况是什么原因造成的呀,还有就是怎么样才可以把超额的数据量清除呢?
|
|
|
|
|
共 3 个关于本帖的回复 最后回复于 2020-4-1 21:25