这样的网页如何提取

http://so.wanfangdata.com.cn/Result.aspx?c=001001&q=2010%2F%28440%29
这是我要提取的网页,主题名是wf2010.我用第一页做测试,提取如下项目( 我配置规则后的提取结果):
<序号>1.
ShowDetail.aspx?dbname=MDS_QIKAN&mfn=32270790
<标题>落实中央经济工作会议精神 加快发展现代交通运输业
<刊类>[中文期刊]
<刊名>[中文期刊]
<刊年>2010
<刊卷期>年卷001期
<作者>[中文期刊]
<摘要>学习贯彻中央经济工作会议精神,把思想和行动统一到中央的部署和要求上来,是交通运输系统各级领导干部的首要任务.文章基于中央经济工作会议的部署和要求,分析了交通运输发展工作的思路与重点,提出了
<关键词>[中文期刊]
现在遇到了两个问题;
1、改网页要post登录。登录名是guest,密码是password。但metasutdio无法post登录,我每次先IE里面登录后,才可再在metasutdio中采集,请问这样解决。
2、采集结果不正确。以下三项的采集结果都变成了[中文期刊],请问这样如何解决。
<刊名>[中文期刊]
<作者>[中文期刊]
<关键词>[中文期刊]

是否有不需登录即可提取的网页

该网站好像没有注册用户的按钮,我访问不了这个主题的样本页面,是否有不需登录的样本页面?这样我才能帮你看一下定义的信息结构是否正确。

定义信息结构时在MetaStudio的Bucket Editor工作台上有没有测试一下规则是否符合预期?

先登录后提取

MetaSeeker本身登录不了,需要在Firefox中登录,然后运行MetaSeeker即可。因为这个网站需要登录才能看内容,等我注册个帐号才能验证你的主题

工具在哪儿呢?

没有找到呀。

此处免费下载网页内容抓取工具

下载地址: http://www.gooseeker.com/cn/node/download/front,请注意阅读下载流程,需要先申请MetaSeeker服务帐号。