Go 的 http.Client 默认不自动重试且不将 HTTP 状态码(如 400/503)视为错误;需显式检查 resp.StatusCode 并关闭 resp.Body;用 errors.Is/errors.As 判断网络错误类型;JSON 解析失败需分类处理;重试须限制次数、超时与退避。
http.Client 默认不自动重试,错误必须显式判断Go 标准库的 http.Client 在请求失败时不会重试,也不会自动解包 HTTP 状态码为错误——哪怕返回的是 400 或 503,resp.StatusCode 仍是合法值,err 为 nil。真正的错误只发生在网络层(如 DNS 失败、连接超时、TLS 握手失败)或客户端配置问题(如 URL.Parse 失败)。这意味着:你必须自己检查 resp.StatusCode 范围,并根据业务需要决定是否视为错误。
err != nil 就认为请求成功,结果把 401 Unauthorized 当作正常响应处理4xx 和 5xx 统一返回自定义错误,例如 fmt.Errorf("API error: %d %s", resp.StatusCode, resp.Status)
resp.Body 必须关闭,即使出错也要 defer resp.Body.Close(),否则会泄漏连接errors.Is 和 errors.As 区分网络错误类型Go 1.13+ 的错误包装机制让错误分类更可靠。直接比对 err.Error() 字符串容易失效(比如超时错误消息在不同 Go 版本中略有差异),而用 errors.Is 可精准识别底层原因。
errors.Is(err, context.DeadlineExceeded) → 请求超时(包括 Client.Timeout 或手动 context.WithTimeout)errors.Is(err, syscall.ECONNREFUSED) → 连接被拒(服务未启动、端口错误)errors.As(err, &net.OpError{}) → 捕获更细粒度的网络操作错误(如 DNS 解析失败)strings.Contains(err.Error(), "timeout"),它不可靠且难测试调用 API 后调用 json.Unmarshal 是常见步骤,但失败原因多样,不能一概而论地 panic 或忽略。
io.EOF 或 io.Err
UnexpectedEOF:响应体为空或截断(可能服务端提前关闭连接)json.SyntaxError:响应不是合法 JSON(比如返回了 HTML 错误页或 plain text)json:"field_name,omitempty"),或改用 map[string]interface{} + 类型断言做柔性解析resp.StatusCode 再尝试 json.Unmarshal,避免对 404 响应体硬解码简单重试容易引发雪崩(尤其下游已过载时),必须加限制。标准 http.Client 不支持重试,需手动封装。
context.WithTimeout 包裹整个重试流程,防止无限循环(例如总耗时不超过 10 秒)time.Sleep 加退避,推荐指数退避:time.Second * time.Duration(1(i 为第几次重试)
context.DeadlineExceeded、net.OpError)、503 Service Unavailable;跳过 400 Bad Request 或 401 Unauthorized
http.Request 的 Body 是 io.ReadCloser,不可重复读,需用 bytes.NewReader 重新构造func doWithRetry(ctx context.Context, req *http.Request) (*http.Response, error) {
var resp *http.Response
var err error
for i := 0; i < 3; i++ {
select {
case <-ctx.Done():
return nil, ctx.Err()
default:
}
// 重用 req.Body 需提前保存原始数据(假设是 bytes)
if req.Body != nil {
if b, ok := req.Body.(*bytes.Reader); ok {
req.Body = io.NopCloser(bytes.NewReader(b.Bytes()))
}
}
resp, err = http.DefaultClient.Do(req)
if err == nil && resp.StatusCode >= 200 && resp.StatusCode < 300 {
return resp, nil
}
if !shouldRetry(err, resp) {
break
}
time.Sleep(time.Second * time.Duration(1<HTTP 状态码语义、错误包装层级、Body 可重用性——这三点在真实项目里最容易被跳过,结果是日志看不出错在哪,重试逻辑掩盖了根本问题,或者连接池被耗尽。