无法利用onclick操作进行自动翻页?

这个网页的翻页只提供了onclick操作,建立记号线索之后仍然无法自动翻页?
希望高手指教。

主题名:youranq_gdt_taxlaw
目标网页:http://portal.gd-n-tax.gov.cn/policy/jsp/content_list.jsp

翻页跟onclick无关

用onclick翻页不影响DataScraper抓取,但是这个网页有点特殊。选择MetaStudio菜单“配置”->"首选项“,弹出的窗口有两个tab窗口,选择第二个,是关于线索定位的,选择”只用id“,这样可以避开网页上的不合适的@class值的干扰。不过这样,就降低了抓取规则的适用性。

如果是企业版用户,就比较好处理,手工将MetaStudio生成的抓取规则稍微调整一下就好了

另外再有一个案例

第一层是:
youranq_cninfo_baseinfo
第二层是:
youranq_cninfo_baseinfo_content

1.里面的内容链接指向的都是同一个网页,只通过onclick来传递参数,现在按照常规的方法抓取出来的地址都是一样的,所以生成给下一层content执行的只有一个线索;

2.另外,作为课题研究,这里面还有深市主版、中小企业版几个标签?能否用哪种线索(例如相对线索)来逐个抓取呢?

需要抓IP包研究一下

用MetaSeeker企业版解决不了这个问题,这样的问题都需要编写特别的程序予以解决,通常有如下步骤:

1,用抓包工具看看发起了什么样的http请求;
2,如果能够使用一个参数构造出网址,则直接在MetaSeeker服务器数据库中插入这样的网址就行,比如,这个据潮资讯网页上每个网址都有参数brief?szmb000001,也许可以构造出网址
3,如果不能构造出网址,那么直接写程序模拟http消息

这个课题要留待有时间再仔细研究了

有点可惜,这个课题要留待有时间再仔细研究了

最好设置AJAX抓取选项

在MetaStudio上选择菜单“延长模式”和“积极模式”,可以打开AJAX选项。

您定义的信息结构有个严重错误,在Clue Editor工作台上,输入的主题名应该与本主题名一致,这样才是翻页抓取

非常感谢fuller大的详尽解答!

首先非常感谢非常感谢fuller大的详尽解答!
由于存了一两个版本,导致另存的时候忘记改线索里面的主题名了,谢谢提醒。

这个网页看似比较普通,但是类名比较混乱,父子同名,单双行异名,不知道现在的操作将来在第二级抓取的时候有无风险。

尝试了楼上的两条建议,看见scaper里面界面闪了一下,again1都出来了,但是等了一段时间仍旧没有翻过去。
教程里面说,线索映射尽量找有类名的做映射,通用性强一点。
在这个案例中,已经做了几次尝试,暂时问题还是没解决。

youranq_gdt_taxlaw

可以参考这个信息结构

主题名是:demo_youranq_gdt_taxlaw,可以翻页。

问题解决了

看来准确定义好线索映射真的很重要!二层抓取规则也建立好了。非常感谢!