21#
plovex 初级会员 发表于 2017-1-19 19:43:22 | 只看该作者
Fuller 发表于 2017-1-19 15:06
要把多个结果文件匹配起来,需要利用结果文件中的一些特殊字段,具体参看《XML文件结构》

这个网站的内 ...

文章看懂了,但是数据清洗程序要怎么做呢。。。能给发个例子么
举报 使用道具
22#
Fuller 管理员 发表于 2017-1-19 23:51:35 | 只看该作者
plovex 发表于 2017-1-19 19:43
文章看懂了,但是数据清洗程序要怎么做呢。。。能给发个例子么

没有例子。就是在数据库中,把你采集下来的多个结果文件合并到一起,自己写sql程序就行了
举报 使用道具
23#
plovex 初级会员 发表于 2017-1-20 12:15:36 | 只看该作者
Fuller 发表于 2017-1-19 23:51
没有例子。就是在数据库中,把你采集下来的多个结果文件合并到一起,自己写sql程序就行了
...

明白了,谢谢~我以为咱们这里有功能呢
举报 使用道具
24#
Fuller 管理员 发表于 2017-1-20 12:22:39 | 只看该作者
plovex 发表于 2017-1-20 12:15
明白了,谢谢~我以为咱们这里有功能呢

这样的处理功能都得定做,无法做成通用的,要针对每个表的特殊情况进行合并
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 利用AI阅读和分析文本:扣子COZE记录用户反
  • 在网页片段内直观标注——以B站评论采集为
  • 利用AI阅读和分析文本:使用COZE建设游记文
  • 使用AI工具Kimi生成python代码为文本分析结
  • 苹果mac电脑安装集搜客网络爬虫软件失败的

热门用户

GMT+8, 2024-11-23 12:56