工程名字为qun_mem_list,在抓取微群list中(http://q.weibo.com/225241/members/all)翻页时显示the clue implemented with AJAX is not in type of inthread !Skipped!怎么解决啊
在Clue Editor工作台上,clue1是用于翻页抓取的,应该设置成inthread类型,在操作区左端有两个多选框(checkbox),第二个就是设置inthread类型的,应该勾选。这样才能实现AJAX翻页抓取。对于非Ajax网页来说,不勾选也行,就会将下一页的网址作为一条新线索存下来。但是,对于Ajax网页,一定要勾选,因为下一页实际上没有一个具体的网址。
能翻到第二页了但是翻到第二页就抓取停止了,这是问什么呢?
新浪微博,腾讯微博,还有很多社交网站,网页内容是局部刷新的,翻页的时候,观察网页地址,是不变的。这类网页,设置AJAX抓取选项时一定要同时选择积极模式和延长模式。在MetaStudio的“配置”菜单下。你再试试,告诉我结果
谢谢
翻页抓取新浪微群成员列表的正确方法
在Clue Editor工作台上,clue1是用于翻页抓取的,应该设置成inthread类型,在操作区左端有两个多选框(checkbox),第二个就是设置inthread类型的,应该勾选。这样才能实现AJAX翻页抓取。对于非Ajax网页来说,不勾选也行,就会将下一页的网址作为一条新线索存下来。但是,对于Ajax网页,一定要勾选,因为下一页实际上没有一个具体的网址。
能翻到第二页了但是抓取停止了
能翻到第二页了但是翻到第二页就抓取停止了,这是问什么呢?
新浪微博局部刷新网页的抓取方法
新浪微博,腾讯微博,还有很多社交网站,网页内容是局部刷新的,翻页的时候,观察网页地址,是不变的。这类网页,设置AJAX抓取选项时一定要同时选择积极模式和延长模式。在MetaStudio的“配置”菜单下。你再试试,告诉我结果
谢谢
谢谢