集搜客的运行日志在哪里查看?
举报 使用道具
| 回复

共 2 个关于本帖的回复 最后回复于 2015-12-23 22:48

沙发
xandy 论坛元老 发表于 2015-12-23 21:30:43 | 只看该作者
在本地的.metaseeker文件夹里可以看到运行日志,只会保存采集网址,不会具体到哪些数据失败的。
举报 使用道具
板凳
Fuller 管理员 发表于 2015-12-23 22:48:22 | 只看该作者
xandy 发表于 2015-12-23 21:30
在本地的.metaseeker文件夹里可以看到运行日志,只会保存采集网址,不会具体到哪些数据失败的。 ...

这个说法不太明确。.metaseeker文件夹中的日志文件是metaseeker.log.txt,如果文件很大,会分成多个文件,最新的总是metaseeker.log.txt。

最新版本GooSeeker软件在这个文件中只存储告警和错误级别的日志,而且这个日志主要注明爬虫抓取失败的具体原因,通常不容易看明白是采集哪个网址失败的。

用DS打数机,选中某个抓取规则,点击鼠标右键,用统计菜单可以看到失败线索的数量。如果是当前窗口采集网页的,则会在下部日志列表中显示具体的原因,还有具体的线索号。记住这个线索号,到MS谋数台上,选择菜单 工具-〉加载规则-〉按线索,输入这个线索号,就能查看这个网址为什麽失败了
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 运行Apple无法验证的程序的方法
  • 文本聚类分析软件的安装和使用方法
  • 利用AI阅读和分析文本:扣子COZE记录用户反
  • 在网页片段内直观标注——以B站评论采集为
  • 利用AI阅读和分析文本:使用COZE建设游记文

热门用户

GMT+8, 2024-12-19 12:08