爬了一部分然后就返回503了
举报 使用道具
| 回复

共 5 个关于本帖的回复 最后回复于 2021-4-6 16:02

来自 6#
maomao 论坛元老 发表于 2021-4-6 16:02:50 | 只看该作者
集搜客有采集Amazon亚马逊的快捷工具,输入网址,就可以采集,不用自己做采集规则,非常快捷方便。
举报 使用道具
沙发
ym 版主 发表于 2015-12-16 17:30:32 | 只看该作者
503是一种HTTP状态码。英文名503 Service Unavailable与404(404 Not Found)是同属一种网页状态出错码。由于临时的服务器维护或者过载,服务器当前无法处理请求。这个状况503是临时的,并且将在一段时间以后恢复。但并不意味着必须在服务器过载的时候使用它。某些服务器只不过是希望拒绝某些客户端的连接。
举报 使用道具
板凳
ym 版主 发表于 2015-12-16 17:32:17 | 只看该作者
爬数据的时候出现503,应该是服务器拒绝了访问,那就暂停采集,缓一段时间再采集,并且要注意放慢采集速度和设置采集的间隔周期
举报 使用道具
地板
xandy 论坛元老 发表于 2015-12-21 14:13:56 | 只看该作者
有网友说就算解决了亚马逊503问题,amazon返回给爬虫的价格也是错的,会这样吗?
果真是这样的话,要怎样才能跑到正确的价格。
举报 使用道具
5#
Fuller 管理员 发表于 2015-12-21 15:19:05 | 只看该作者
xandy 发表于 2015-12-21 14:13
有网友说就算解决了亚马逊503问题,amazon返回给爬虫的价格也是错的,会这样吗?
果真是这样的话,要怎样才 ...

集搜客GooSeeker采用精准抓取技术,抓取的时候会做校验,根据设定的关键内容校验是否有正常的内容,如果定位到才抓取,如果没有发现,则会报日志。所以,抓到错误价格的可能性很小。出现503的时候,整个网页内容都不一样了,会报错
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 运行Apple无法验证的程序的方法
  • 文本聚类分析软件的安装和使用方法
  • 利用AI阅读和分析文本:扣子COZE记录用户反
  • 在网页片段内直观标注——以B站评论采集为
  • 利用AI阅读和分析文本:使用COZE建设游记文

热门用户

GMT+8, 2024-12-28 17:04