这个schema为啥使不了。。。

hammerlet_anti_qiangguo_post
是这个,很奇怪,当我以一个样本来试的时候,一切正常,但是当我用它的上一层后去线索之后,就不行了。
我感觉是要想是datascraper设置的问题。
之前我取消普通模式,他就只能抓一页上的某几条,当我使用普通模式,他就可以了。
但是现在使用普通模式,当她的线索数是400多的时候,就不能用了。。很奇怪。。。
求指教!

抓取人民网论坛的问题没有看懂

您说的400个线索是指什么?是要翻页400次还是有400个线索等待抓取?用普通模式速度会慢很多。

您遇到的问题有什么现象?

是400个线索等待被抓

就是我设置了两层。第一层抓完了,得到四百个线索。
然后我用第二层抓,第二层就抓不了了。。不知道为什么。
但实际上,我设置第二层的schema的时候,我用它去抓那个样本页面时,是能够抓的。但是当第一层抓完,得到400个线索给第二层,他就抓不了了,连我原来的样本页面也抓不了,不知道为什么。

或者能否麻烦您帮我看一下这个schema问题出在哪儿

hammerlet_anti_qiangguo_post
他本来还有线索在。很奇怪。
请问这种静态的网页,滚屏参数都设置成0,都是可以的是吗?
谢谢!

两层要分别抓取

这个是第二层的吗?

如果两层的话,要分别抓取,或者放在crontab.xml中自动抓取,可以放在两个线索中并行抓取,也可以在同一个线索中顺序抓取。

抓取论坛通常不用设置AJAX抓取模式,所以,无论是否设置滚屏参数都不影响

是第二层的

第一层抓完后,第二层的线索已经都有了,但就是几乎抓不了。您能帮忙看看这个schema有什么问题吗?
谢谢!

单独加载这个主题看起来很正常

失败率很高?可以将失败的线索号记录下来,在MetaStudio上,选择菜单“编辑”-〉“信息结构”-〉“加载”-〉“按线索”,看看为什么失败