105人参与 • 2025-04-24 • Golang
生产环境有个golang应用上线一个月来,占用内存不断增多,约30个g,这个应用的dau估计最多几十,初步怀疑有内存泄露问题。
下面是排查步骤:
内存泄露可能点:
我们的web框架使用的是gin,结合pprof
package main
import (
"github.com/gin-contrib/pprof"
"github.com/gin-gonic/gin"
)
func main() {
router := gin.default()
pprof.register(router)
router.run(":8090")
}浏览器访问:http://ip:port/debug/pprof

着重看下heap和goroutine


heap中发现代码中一个内存缓冲bigcache比较占用内存,goroutine中发现总共466700个goroutine,第一处代码占了466615个,这是肯定不正常的。至此,已基本确定内存泄露的点了,继续验证:
go tool pprof http://ip:port/debug/pprof/heap
输入top命令:


之前通过http://ip:port/debug/pprof/heap?debug=1查看到的bigcache占用内存,go tool 分析之后排除了内存泄露的可能性,因为程序在运行一段时间后,bigcache占用内存并未增长,goph.newunknown方法的代码位置和goroutine中client.go:72的指向是一致的,所以可以确定就是这块代码的问题。
问题代码:
func newunknown(user string, addr string, auth auth, t time.duration) (*client, error) {
type st struct {
cli *client
err error
}
var ch = make(chan st) # 无缓冲队列
go func() {
cli, err := newconn(&config{
user: user,
addr: addr,
port: 22,
auth: auth,
timeout: defaulttimeout,
callback: ssh.insecureignorehostkey(),
})
ch <- st{ # 写阻塞 ①
cli: cli,
err: err,
}
}()
for {
select {
case <-time.after(t): # ②
return nil, fmt.errorf("new ssh client time out")
case res := <-ch:
return res.cli, res.err
}
}
}由于ch是无缓冲的channel,①处写数据可能会阻塞,当②超时返回时,由于ch没有被接收方,①处的goroutine会一直阻塞,造成内存泄露。
var ch = make(chan st, 1)
设置一个有缓冲队列的channel,这样就算没有接收方,也能往里写数据。
以上为个人经验,希望能给大家一个参考,也希望大家多多支持代码网。
您想发表意见!!点此发布评论
版权声明:本文内容由互联网用户贡献,该文观点仅代表作者本人。本站仅提供信息存储服务,不拥有所有权,不承担相关法律责任。 如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 2386932994@qq.com 举报,一经查实将立刻删除。
发表评论