韭研

小米首个推理大模型开源7B参数规模能力超越OpenAl o1


小米AI模型的算力支持主要依赖自建算力基础设施与外部合作伙伴的协同,形成了“核心自控+生态协同”的体系。以下是关键支持方的分类及具体信息:

一、核心自建算力:万卡级GPU集群

1. 自研GPU集群
小米自2024年起加速部署万卡级GPU集群,主要用于训练基础大模型(如MiLM-6B)。截至2025年,已部署约6500张GPU,并计划持续扩容以支持更高强度的AI训练需求。

· 技术目标:支撑端云协同的算力架构,优化手机端13亿参数模型的本地运行效率。

2. 自研芯片与操作系统

· 澎湃OS:集成60亿参数端侧模型,通过HyperAI技术实现跨设备算力调度,降低对云端算力的依赖。

· 玄戒芯片:自研AI加速芯片,计划应用于平板等设备,提升本地算力性能。

二、外部算力合作伙伴

(一)云服务与数据中心

1. 金山云

· 核心地位:小米最主要的算力服务商,签订新框架协议(2025-2027年关联交易上限提升至40.35亿元),提供GPU集群租赁、AI训练推理等全栈服务。

· 技术协同:与小米联合优化算力调度算法,支撑澎湃OS端云协同架构。

2. 其他云服务商

· 浪潮信息、紫光股份:提供AI服务器及网络设备,支撑小米数据中心算力扩容。

· 中科曙光:参与高性能计算集群建设,助力大模型训练效率提升。

(二)硬件与基础设施

1. 光模块与芯片供应商

· 中际旭创、芯原股份:为小米及金山云提供高速光模块、AI芯片设计支持,优化算力传输效率。

· 胜宏科技:供应高端AI数据中心HDI电路板,提升服务器算力密度。

2. 数据中心建设与运维

· 宁波建工(中经云):提供1.2万机柜的数据中心租赁服务,覆盖京津冀及上海区域。

· 中创环保、亚康股份:通过算力租赁、服务器销售等业务支持小米算力需求。

(三)数据与技术服务

1. 训练数据支持

· 拓尔思:提供多模态预训练数据集,优化小米大模型的语义理解能力。

· 海天瑞声:合作开发垂直领域数据集,提升模型在汽车、IoT场景的适配性。

2. 算法与工程优化

· 并行科技:提供超算云服务,加速模型训练迭代。

· 利通电子:布局AI算力租赁,为小米提供弹性算力资源。

三、产业链协同生态

小米通过投资与战略合作,构建了覆盖芯片设计-服务器制造-数据中心运营-数据服务的全链条生态:

· 资本层面:战略投资芯原股份(AI芯片)、大位科技(IDC服务商)等企业。

· 技术整合:与华为昇腾共建国产算力底座,推动端侧模型与云端算力的无缝衔接。

四、未来算力规划

1. 投入规模:未来五年计划投入超千亿研发费用,重点布局AI算力与芯片研发。

2. 技术方向:

· 推动端侧模型轻量化,降低对云端算力的依赖。

· 探索量子计算与存算一体芯片等前沿技术,提升算力能效比。

总结

小米AI模型的算力支持呈现“自研核心+生态协同”的双轮驱动模式:

· 自研能力:万卡GPU集群、澎湃OS端侧优化、玄戒芯片。

· 外部生态:金山云(主力算力供应商)、中际旭创/拓尔思(硬件与数据)、宁波建工/中创环保(数据中心)等。
这一体系既保障了算力自主可控,又通过开放合作快速扩展能力边界。

资讯解析

行业:
科技
标的:
金山云 浪潮信息 紫光股份 中科曙光 中际旭创 芯原股份 胜宏科技 宁波建工 中创环保 亚康股份 拓尔思 海天瑞声 并行科技 利通电子
标签:
小米 AI算力 自研芯片 金山云 端云协同 人工智能 云计算 芯片 国产替代 小米AI生态 算力基础设施
摘要:
小米AI模型的算力支持主要依赖自建算力基础设施与外部合作伙伴的协同,形成了‘核心自控+生态协同’的体系。未来五年计划投入超千亿研发费用,重点布局AI算力与芯片研发。
多方:
小米通过自研和生态协同构建了强大的AI算力支持体系,未来投入将进一步增强其竞争力,特别是在端侧模型优化和国产替代方面具有优势。
空方:
大规模投入可能带来财务压力,且外部合作伙伴的依赖可能影响算力的稳定性和自主可控性。