快捷导航
DS打数机运行了很多线索,他们的结果文件放在了一起,怎么把他们区分出来?
举报 使用道具
| 回复

共 1 个关于本帖的回复 最后回复于 2016-11-2 21:03

Fuller 管理员 发表于 2016-11-2 21:03:47 | 显示全部楼层
参看《XML文件结构》,里面的clueid是线索编号,fullpath是被采集的网址,这些信息可以区分这个结果文件是哪个线索的。
其实还有个简单方法,就是看结果文件名,格式是:主题名_线索编号_时间戳.xml,所有文件名的格式都是统一的
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Jupyter Notebook使用sklearn的TF-IDF算法
  • 基于TSC 理论的网络社区中知识动员模式研究
  • 网页数据采集使用嵌套整理箱获得有层次的数
  • 我国旅游管理研究的知识来源与结构—基于文
  • 面向用户评论的关键词抽取研究-以美团为例

热门用户

GMT+8, 2021-7-30 12:50