每条网址都会有个线索编号clueid,DS打数机抓取网页的时候,如果遇到网页结构与抓取规则不符,就会产生错误日志,所以,我们可通过这个线索编号找到采集失败的网址,例如: 操作:到MS谋数台上的工具菜单->加载规则->按线索编号,输入线索编号就能把失败网址和规则都加载出来。 不同的错误会有不同的消息,但都要具体加载规则进行分析,分析方法见怎样解决规则采集失败/遗漏的问题 请注意:这个分析功能一定要用MS谋数台,GS浏览器在定义规则模式下没有加载分析功能 MS谋数台的启动方法如下图,在GS浏览器顶部的工具条的右端,有MS谋数台按钮 |