我是刚刚开始学习使用metastudio抓取网上的数据,现在遇到的问题是:要分级翻页抓取BBS主帖及回帖,网页是:http://topic.csdn.net/s/Java/0.html,不知道用那种线索实现翻页和分级抓取。很急,希望能得到帮助,不甚感激!
我感觉要用相对线索,但只提取了两页,请帮我看看用哪种线索,再线等,着急呢。
这个网页不是传统意义的翻页,用个两级抓取,先抓顶部页码表示的超链接,然后,进入到那个分页去抓内容。
是这样呀,有这个工具和论坛太好了,谢谢!
我感觉要用相对线索
我感觉要用相对线索,但只提取了两页,请帮我看看用哪种线索,再线等,着急呢。
不用翻页
这个网页不是传统意义的翻页,用个两级抓取,先抓顶部页码表示的超链接,然后,进入到那个分页去抓内容。
是这样呀,有这个工
是这样呀,有这个工具和论坛太好了,谢谢!