fuller,请问激活,去活,统计,这三个功能如何使用?一直不会使用。 我在微博上@你了,怎么没反应,呵呵。不常上吗??
一直想组织人再写一写文档,但是一直没有资源。这些内容在现有的文档中写了,但是文档组织得不合理,大家总觉得不好查找。所以,有问题直接留言或者发email。
在MetaSeeker系统中,被抓取网页的地址存储在“线索”中,线索是有状态的,这样的设计会造成比较大的服务器资源损耗,但是,如果将MetaSeeker用于数据挖掘和商业情报分析,线索将很有用。
线索最重要的几个状态:start(等待抓取),unknownschema(抓取失败),fetched(某个DataScraper正在抓取)和完成状态。
如果抓取出现故障了,既没有抓完,也不是start状态,就可以用激活再将它变成start状态,去活就是将start状态的变成完成状态。详细参看http://www.gooseeker.com/cn/node/document/datascraper/userbookv4/manclue
需要文档进一步说明
一直想组织人再写一写文档,但是一直没有资源。这些内容在现有的文档中写了,但是文档组织得不合理,大家总觉得不好查找。所以,有问题直接留言或者发email。
在MetaSeeker系统中,被抓取网页的地址存储在“线索”中,线索是有状态的,这样的设计会造成比较大的服务器资源损耗,但是,如果将MetaSeeker用于数据挖掘和商业情报分析,线索将很有用。
线索最重要的几个状态:start(等待抓取),unknownschema(抓取失败),fetched(某个DataScraper正在抓取)和完成状态。
如果抓取出现故障了,既没有抓完,也不是start状态,就可以用激活再将它变成start状态,去活就是将start状态的变成完成状态。详细参看http://www.gooseeker.com/cn/node/document/datascraper/userbookv4/manclue