在http://www.metaseeker.cn服务器上展示的电子书搜索和威客任务搜索只是一个示例,MetaSeeker工具包的能力不仅仅局限于此,MetaSeeker工具包(在线版)已经发展成三个工具:
- MetaStudio,用于定制目标网页内容提取规则和内容格式化规则,完全免除编程和调试的麻烦,全图形界面,定制一个新网站的提取规则只需要几分钟
- DataScraper,用于连续且高效地从目标网站上提取内容,并滤除不需要的内容,存成XML文件
- SliceSearch,将提取到的内容存储到搜索引擎中,提供强大的搜索功能和内容管理功能,用于快速部署垂直搜索和商业推荐引擎。
注:SliceSearch暂时没有公开下载,因为自动部署功能还没有完善,需要该个工具的用户请直接与我们联系。
MetaSeeker实际上是一个通用的互联网内容格式化和聚集和管理工具包,其中SliceSearch可以做任何领域的垂直搜索,也能够做跨领域的综合搜索,虽然是免费使用的,功能却很强大,基于多项专利技术,并且是一个下一代语义搜索引擎。全文索引,同时按语义索引,并提供基于语义导航的结果提炼技术(专利技术),除了部分管理数据使用关系数据库管理以外,全部使用嵌入式索引库系统,其速度是基于关系数据库的垂直搜索系统无法比拟的。
另外,该系统推荐使用与google,百度等一致的用户查询条件输入方式,具有一致的用户体验,不像其它基于关系数据库的垂直搜索要按字段输入查询条件(当然,这种方式SliceSearch也是支持的),由于采用专利保护的基于语义导航的结果提炼技术,查准率可以逐步提炼,很适合手机搜索/电视搜索等没有全字符键盘的应用。
SliceSearch做各种垂直搜索时,引擎部分不需要定制开发,全部基于图形界面的配置,例如,http://www.metaseeker.cn上的威客任务搜索,其任务分类,任务信息结构,信息结构和信息属性(字段)的索引方法,每个字段怎样显示等等都是通过图形界面配置成的,就像使用Drupal(本站使用的CMS)建立网站一样,所以,SliceSearch也称为OMS(信息对象管理系统),因为SliceSearch管理的是异构的信息对象,而不是自由文本。
总之,MetaSeeker工具包适合快速部署各种领域的垂直搜索,例如,法律搜索、专利搜索、法律案件搜索、文体日程搜索等等