Fuller 发表于 2023-11-28 10:24
分析一个网址是否使用某个规则的方法:
1. 在爬虫浏览器中访问这个网址
2. 进入定义规则模式
longbingjun 发表于 2023-11-28 11:03
我采集设定规则的网址都没有问题;但是帖子里面放的采集失败的网址就不行。明明结构一样的哇
...
Fuller 发表于 2023-11-28 11:18
超时设置了多少?起码要一分钟,如果网站很慢,还要更长。延迟抓取不要超过超时,超时起码比延迟多30秒 ...
Fuller 发表于 2023-11-28 11:18
超时设置了多少?起码要一分钟,如果网站很慢,还要更长。延迟抓取不要超过超时,超时起码比延迟多30秒 ...
longbingjun 发表于 2023-11-28 11:38
运行日志显示的是滚屏次数不够和超时时间不够。可是昨天采集的时候网速很快啊。现在把采集失败的链接激活 ...
longbingjun 发表于 2023-11-28 11:55
滚屏次数一般设置多少合适呢,我的是5
欢迎光临 集搜客GooSeeker网络爬虫 (https://www.gooseeker.com/doc/) | Powered by Discuz! X3.2 |