最后登录 1970-1-1
最后登录 2024-5-3
不加载网页31128101829.png (10.59 KB, 下载次数: 390)
下载附件
2023-11-28 10:24 上传
Fuller 发表于 2023-11-28 10:24 分析一个网址是否使用某个规则的方法: 1. 在爬虫浏览器中访问这个网址 2. 进入定义规则模式
longbingjun 发表于 2023-11-28 11:03 我采集设定规则的网址都没有问题;但是帖子里面放的采集失败的网址就不行。明明结构一样的哇 ...
超时1648.png (54.53 KB, 下载次数: 393)
2023-11-28 11:17 上传
屏幕截图 2023-11-28 112413.png (39.33 KB, 下载次数: 401)
2023-11-28 11:25 上传
屏幕截图 2023-11-28 112413.png (39.33 KB, 下载次数: 390)
2023-11-28 11:26 上传
Fuller 发表于 2023-11-28 11:18 超时设置了多少?起码要一分钟,如果网站很慢,还要更长。延迟抓取不要超过超时,超时起码比延迟多30秒 ...
longbingjun 发表于 2023-11-28 11:38 运行日志显示的是滚屏次数不够和超时时间不够。可是昨天采集的时候网速很快啊。现在把采集失败的链接激活 ...
longbingjun 发表于 2023-11-28 11:55 滚屏次数一般设置多少合适呢,我的是5
发表回复 回帖并转播 回帖后跳转到最后一页
GMT+8, 2024-5-4 15:40
共 9 个关于本帖的回复 最后回复于 2023-11-28 18:33