提示说URL过长了,当把所有的参数设置完成后,保存规则时就出错,自动退出了。 类似情况该如何解决呢?
请告诉我目标网页URL,我们看看是什么原因
是阿里妈妈联盟的详细页面,不知道你们是否有帐号可登陆呢?用淘宝帐号亦可登陆 我今天采集的页面的URL http://www.alimama.com/union/promotion/merchandisePromotion.htm?mid=0&q=...
有些网页自动地快速地刷新网页内容,那么就需要在下次刷新之前完成抓取规则的定义,否则,则无法将抓取规则存下来。这是MetaStudio的一个bug,下一个版本才能解决。
目前,只能提供操作速度,可以先定义一个简单的信息结构,马上点击Schema按钮上载信息结构,然后,再先后点击MetaStudio的菜单 文件-〉刷新DOM 和 文件-〉分析页面 ,做完后马上再为信息结构增加新的信息属性,再上载。
这个网页我无法访问,所以,无法实际做测试
URL过长不影响抓取规则定义
请告诉我目标网页URL,我们看看是什么原因
呃,该网站需要登陆
是阿里妈妈联盟的详细页面,不知道你们是否有帐号可登陆呢?用淘宝帐号亦可登陆
我今天采集的页面的URL
http://www.alimama.com/union/promotion/merchandisePromotion.htm?mid=0&q=...
可能是动态刷新内容造成的
有些网页自动地快速地刷新网页内容,那么就需要在下次刷新之前完成抓取规则的定义,否则,则无法将抓取规则存下来。这是MetaStudio的一个bug,下一个版本才能解决。
目前,只能提供操作速度,可以先定义一个简单的信息结构,马上点击Schema按钮上载信息结构,然后,再先后点击MetaStudio的菜单 文件-〉刷新DOM 和 文件-〉分析页面 ,做完后马上再为信息结构增加新的信息属性,再上载。
这个网页我无法访问,所以,无法实际做测试