网页内容抓取软件工具DataScraper的信息提取结果能否导入关系数据库?

问:网页内容抓取软件工具DataScraper信息提取结果怎样导入关系数据库?有没有现成的编程接口API?


答:XML转SQL应该有现成的共享软件,可以到网上搜索一下。但是要考虑几个问题:DataScraper相比其他信息提取软件有个强项:能够提取树状内容,很多软件只能提取表状内容,但是树状内容不能直接映射到一个关系数据库表中,要使用关系数据库的几个范式原则解构树状内容成有特定关系的数据库表,这个过程不一定有现成的软件做,但是,在大部分信息提取情况下,不需要提取树状结构,例如,提取论坛帖子就不需要树状结构,在语义结构定义和信息提取规则生成工具MetaStudioBucket Editor工作台上定义的信息结构信息属性只有一个层次,即全部位于整理箱名字之下,这就是表状结构,很容易转成SQL语句。