已经定义好的信息提取规则,测试时可以显示输出结果。后来用metastudio加载出来显示“无法定位容器No.0”,“无法定位信息属性No.1(情景1)”……直到最后一个信息属性提示”无法定位……“,这是什么原因呀?应该怎么解决?
是哪个网站?像淘宝、微博这样的网站,网页是动态的,很多内容用javascript动态生成,这样的内容在网页加载之初并没有出现在html文档中,所以,再次加载的时候会遇到无法定位容器,或者其它定位问题,或者在浏览器选择某个内容的时候会弹出Cannot find the node这样的提示。
这些都是动态内容造成的,为这样的网站定义采集规则时需要设置ajax选项,参看《抓取AJAX网站》
加载之后过一会儿会提示选择后续分析,一旦选择了后续分析,就好弹出无法定位的提示。
因为很多长网页上的内容一开始并没有加载显示出来,比如,淘宝网页上的图片,或者后面的评论,要滚动鼠标滚轮,滚屏到评论处,观察加载情况,等加载完了再执行后续分析
想要抓取淘宝上一个商品的所有评论信息。 按照《抓取AJAX网站》里的步骤,在设置好信息提取规则之后勾选了延长模式和积极模式,检测后看到结果输出正常,然后上载。再次打开metastudio,加载的时候仍然会弹出无法定位容器等提示。 应该怎么解决呢?
应该打开AJAX选项
是哪个网站?像淘宝、微博这样的网站,网页是动态的,很多内容用javascript动态生成,这样的内容在网页加载之初并没有出现在html文档中,所以,再次加载的时候会遇到无法定位容器,或者其它定位问题,或者在浏览器选择某个内容的时候会弹出Cannot find the node这样的提示。
这些都是动态内容造成的,为这样的网站定义采集规则时需要设置ajax选项,参看《抓取AJAX网站》
提示选择后续分析
加载之后过一会儿会提示选择后续分析,一旦选择了后续分析,就好弹出无法定位的提示。
在后续分析之前要做些动作
因为很多长网页上的内容一开始并没有加载显示出来,比如,淘宝网页上的图片,或者后面的评论,要滚动鼠标滚轮,滚屏到评论处,观察加载情况,等加载完了再执行后续分析
已经勾选了延长模式和积极模式
想要抓取淘宝上一个商品的所有评论信息。
按照《抓取AJAX网站》里的步骤,在设置好信息提取规则之后勾选了延长模式和积极模式,检测后看到结果输出正常,然后上载。再次打开metastudio,加载的时候仍然会弹出无法定位容器等提示。
应该怎么解决呢?