如何用 Go 封装大模型推理服务
本文介绍了使用 Go 语言构建高性能大模型推理服务的方法。文章设计了分层系统架构,定义了支持流式与批量推理的核心接口。通过工作池模式优化并发控制,并引入 LRU 缓存提升性能。文中实现了完整的 HTTP 服务,集成了错误处理与指标监控。最后,文章提供了基于容器化的部署方案、GPU 加速及模型量化等优化建议,旨在构建高效、可扩展的 AI 推理服务。
【工具篇】手把手教你自定义protobuf 标签
本文探讨了protoc生成的pb.go文件中json标签的问题:omitempty导致零值(如0)字段在JSON转换时被忽略,且难以添加其他标签(如form)。提出两种解决方案:一是修改protoc-gen-go源码,通过调整生成方法注入自定义标签;二是使用第三方库protoc-go-inject-tag,在proto文件中添加@gotags注释(如`// @gotags: json:"community_id" form:"community_id"`),再运行工具注入标签。推荐第二种方案,因其侵入性小、操作便捷,无需修改源码即可高效解决标签定制需求。

