回帖该怎么抓呢?

比如微博或者网易的跟帖,很多都是回别人的贴,这样一种帖子和帖子的关系有办法标志出来吗?或者在抓内容的选项中体现出来?
可以做到吗?
谢谢啦!

网易跟贴嵌套抓取不行

新浪微博转发,在页面上只显示两级,可以用固定结构的整理箱来存储抓取到的内容,而网易的新闻评论跟贴,是无限嵌套的,就无法定义信息结构了,因为MetaSeeker的整理箱不允许无限层次的嵌套,整理箱虽然可以嵌套,但是层次必须是事先确定好的。

所以,针对网易跟贴,需要先用MetaSeeker的block特性将所有跟贴一块抓取下来,再用程序分割开。

新浪微博可以一次抓取被转发博文和转发博文