MetaSeeker工具包是否能够提取本地文件内容

能够提取本地HTML文件

当前版本,能够提取本地HTML文件内容,但是不能提取XML文件

本地文件的发布可能有下面两种:
1,使用操作系统的文件管理
2,使用本地HTTP服务器,例如Apache

两种发布方式都能够支持,第一种方式使用file://协议,第二种方式使用http://协议。

由于MetaSeeker工具包最适合从大量的信息结构相同的HTML文件中大批量提取数据,如果一个个文件单独提取,MetaSeeker工具包的优势无法体现,所以,存在本地的HTML文件之间应该是可导航的。