翻页抓取无法进行下去

抓取目标网站:
http://www.tigerdirect.com/applications/category/category_slc.asp?page=1&Nav=|c:4937|&Sort=3&Recs=30
使用规则:
tiger30

遇到问题:
创建规则和线索后,第一页,第二页抓取正常
无法执行第三页的抓取。DOM结构在各网页之间应该非常接近的。
版主能帮我看看原因吗?

提高翻页标志的定位精度

如果网页上既有id属性也有class属性,有配置选项可以用来选择id还是class。MetaStudio自动生成的抓取规则中,如果定位一个DOM节点的表达式很长,也就是说XPath中有很多段路径,尤其采用绝对定位,比如,使用函数position()=n,这样很容易受到网页结构变化的影响,为了提高定位的适应性,可以尽量采用与目标节点近的class和id,这样的相对定位的XPath表达式更有适应性。

MetaStudio菜单“配置”-〉“首选项”,点击后弹出一个窗口,里面有两个tab,选择“线索定位”那个tab,选择偏好class,就能将这个信息结构的翻页规则缩短。

参看:demo_tiger30

另外,为了让翻页规格更有可读性,记号映射的时候不用src属性,而是用alt属性,因为这个网页上src的网址太长了,选择alt效果一样。