|
我正在测试这个快捷采集工具,当前看来并没有问题。
知乎最近一次改版,把网页都改成瀑布流的了,所以,你的这个网址: https://www.zhihu.com/question/37243703/answers/updated ,也是瀑布流的,不再像从前那样是有翻页的。这样就有个很大的问题,随着爬虫自动滚屏,网页会越来越长,那么就对你的电脑有比较高的要求,足够的内存存储很长的网页,网络速度要足够快,不然滚屏的时候就加载不出来新内容。
如果运行了360软件,能采集到的内容会大大减少。建议采集前关了360
|
|