如需帮助,请正确填写email地址

通过联系我们链接,可以留言、提问或者寻求直接帮助,但是,请一定要正确填写您的email地址,经常接收到很多email地址填写不正确的邮件,我们无法通过回信及时提供帮助。

MetaSeeker工具包很强大,但是有个代价:操作有些复杂。虽然一个熟练的操作员可以用几分钟定义一个网站内容的抽取规则,但是要变成熟练的操作员,需要一个学习和实践的过程。鉴于此,如果您是初次使用者,我们会尽可能帮助您熟悉该工具的操作方法。该工具是一个在线的协作式网页抓取工具,我们可以帮助您定义好提取规则并放在网上,您只需操作MetaSeeker工具包中的MetaStudio工具就可以查看我们定义的样例,可以修改并且另存为您自己的提取规则,保存在您自己的服务器空间中。这样,可以大大缩短学习时间。

问题:按教程操作,自己上传的规则host为N

阅读教程:采集当当百货价格以建立比价系统
建立的主题名:cxw_test_dangdang
我抓取的是商品的名称,优惠价格。
这一页的手机商品都抓取了。之后上传……

next 继续操作

阅读教程:翻页抓取当当网价格数据
转到Clue Editor工作台操作,主题名称显示是cxw_test_dangdang。我没有修改。
然后按教程操作完,直接上传。
Q1:这一步,我不知道如何测试这个规则是否可以把下一页的商品抓取。
教程是使用 DataScraper批量抓取
我打开DataScraper,输入我的规则名cxw_test_dangdang,HOST显示为N。
服务器地址是:http://www.metacamp.cn/metacamp/
我的账号,我重新登录,状态时绿色的。然后搜索还是N。
学习教程卡在这一步,非常着急。不知道如何解决。
我用的是官网最新的插件。ff也是匹配的。系统时win7

邮箱:669314508@qq.com

不好意思,问题解决

不好意思,问题解决呢,当初不小心把服务器配置写错了。2个都是http://www.metacamp.cn/metacamp/。
应该1个是http://www.metacamp.cn/metacamp/,1个是http://www.metacamp.cn/datastore/

怎么解决xml的数据合并问题

我在第一级主题(yesky_test)中抓取了列表和指向产品详情的url之后按照上文介绍的方法 添加url线索 定义了另一个主题(yeskey_detail),用于抓取商品具体详情。
商品列表采取分页抓取,每页20个商品,一共10页,然后用DataScraper 抓取yeskey_detail商品详情 发现生成的的xml文件 200个,每个商品详情占用一个xml,想把每个商品详情都存放在一个xml文件里; 怎么解决xml的数据合并问题,是不是我抓取方示不对?

EMAIL: 332984660@QQ.COM

抓取结果文件合并方法

DataScraper抓取网页时,每个网页生成一个XML文件,如果需要合并,则需要自己编写程序。如果是比较复杂的而且数据量很大的项目,可以购买配套的数据入库和清洗软件,这个软件可以与DataScraper配套,自动将抓取结果存入数据库,而且在存入过程中,根据规则进行数据清洗和转换,最后还可以导出成各种格式的文件。

如何保证自己上传的信息结构不被别人删除

1.在metadata的schema List操作台上 我发现 可以删除别人上传的信息结构。我想问如何保证自己上传的信息结构不被别人删除。

另外,上传的信息结构是不是有使用时间,超过使用时间 ,就会被自动删除???

网站抓取规则有权限管理

权限管理的规则同Linux的文件权限是一样的。分成owner, group, other,当前所有人都属于同一个group,而且定义的信息结构的group权限是可改写的。所以,使用在线版建立的信息结构能够被属于同一组的在线版用户删除。

不过我们会定期修改信息结构的权限,进行保护,关闭group的改写权限。

建议升级成MetaSeeker企业版用户或者在线付费用户。在线付费用户将使用其它专用的服务器,不再与免费在线版用户共享服务器。

请问用IE浏览器可以安装MetaSeeker吗

请问用IE浏览器可以安装MetaSeeker吗,我看你们示范操作里只有Firefox浏览器的,我的系统是win XP,IE8.0,已经下载回来了,不知道怎么安装。

请参照如下安装手册

IE浏览器不支持,只支持Firefox3.5.x和Firefox3.6.x浏览器,参考《MetaSeeker安装步骤》