2 12836

在哪里看运行日志?

思秋忆 于 2015-12-23 21:19 发表 [复制链接]
集搜客的运行日志在哪里查看?
举报 使用道具
| 回复

共 2 个关于本帖的回复 最后回复于 2015-12-23 22:48

xandy 论坛元老 发表于 2015-12-23 21:30:43 | 显示全部楼层
在本地的.metaseeker文件夹里可以看到运行日志,只会保存采集网址,不会具体到哪些数据失败的。
举报 使用道具
Fuller 管理员 发表于 2015-12-23 22:48:22 | 显示全部楼层
xandy 发表于 2015-12-23 21:30
在本地的.metaseeker文件夹里可以看到运行日志,只会保存采集网址,不会具体到哪些数据失败的。 ...

这个说法不太明确。.metaseeker文件夹中的日志文件是metaseeker.log.txt,如果文件很大,会分成多个文件,最新的总是metaseeker.log.txt。

最新版本GooSeeker软件在这个文件中只存储告警和错误级别的日志,而且这个日志主要注明爬虫抓取失败的具体原因,通常不容易看明白是采集哪个网址失败的。

用DS打数机,选中某个抓取规则,点击鼠标右键,用统计菜单可以看到失败线索的数量。如果是当前窗口采集网页的,则会在下部日志列表中显示具体的原因,还有具体的线索号。记住这个线索号,到MS谋数台上,选择菜单 工具-〉加载规则-〉按线索,输入这个线索号,就能查看这个网址为什麽失败了
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-19 06:26