请问这个问题怎么解决?

kaidi_demoagain
是这个schema,抓凯迪社区的帖子,因为第一页和和以后几页的样式不一样,所以就在同一主题下做了两个,一个的辅名是default,一个辅名是second,他们分别抓数据的时候挺好的,但是一起使用的时候就不行了,就翻到第二页就不行了。

但我之前用辅名为second的抓,它一直抓到最后一页。

我想请教,是在第二页的时候,同一主题下的两个辅名不同的schema之间的转化出问题了?那么,怎么解决,能否帮忙检查一下这个schema?
谢谢!!!

抓取凯迪的建议

我看了一下,但是没有测试,第一个页和第二页的区别是第一页上有楼主发表的内容。第二页没有这块内容,只有列表。

我的建议:第二个信息结构可以简化一下,只要列表。但是要注意不能在第一个的基础上简单简化,因为,要防止第一个信息结构涵盖第二个的情况。防止DataScraper校验信息结构时总是使用第二个简单的。

另外一个建议:在信息结构中,比如第一个中,将楼主发表的文章相关内容放在一个整理箱中,而跟贴列表放在另外一个整理箱中。这样生成的抓取规则的适应性更强。当一个抓取规则包括网页上很大区域的时候,抓取规则容易不适应。需要切成多个块