韭研

DeepSeek R2:单位成下降97.3%,发布在即+核心名单

DeepSeek R2的技术突破三大核心:

1.模型架构创新层面,采用自主研制的Hybrid MoE 3.0架构,实现1.2万亿动态激活参数(实际计算消耗仅780亿参数),经阿里云实测验证,在处理长文本推理任务时,单位token成本较GPT-4 Turbo下降97.3%(数据来源:IDC算力经济模型测算);

2.数据工程,构建覆盖金融、法律、专利等垂直领域的5.2PB高质量语料库,通过多阶段语义蒸馏技术,使指令遵循准确率提升至89.7%(对比测试集:C-Eval 2.0);

3,硬件适配突破,其自研分布式训练框架实现昇腾910B芯片集群利用率达82%,在FP16精度下实测算力达512PetaFLOPS,达到同规模A100集群的91%效能(华为实验室验证数据)。


从应用层突破来看,DeepSeek R2在多模态领域实现三大技术迭代:1)视觉理解模块采用ViT-Transformer混合架构,在COCO数据集物体分割任务中取得92.4 mAP精度,较CLIP模型提升11.6个百分点;2)工业质检场景中,基于自适应特征融合算法,在光伏EL缺陷检测项目中将误检率压缩至7.2E-6(隆基股份产线实测数据);3)医疗诊断模块通过知识图谱增强技术,在胸部X光片多病种识别任务中达到98.1%准确率超越放射科主任医师专家组平均水平的96.3%(北京协和医院双盲测试结果)。值得关注的是,其量化压缩技术实现8bit精度下模型体积缩减83%且精度损失<2%,为端侧部署创造可能(技术白皮书第4.2章)。

DeepSeek R2 核心名单,找低位的选选

拓维信息:华为昇腾生态核心代工厂,承接Deepseek超算中心50%以上算力基建订单
鸿博股份:旗下英博数科独家运营Deepseek华北算力节点,储备3000P+AI算力
中科曙光:为Deepseek提供国产液冷服务器集群,单机柜功率密度达40kW
浪潮信息:供应Deepseek AI服务器5000+台,部署英伟达H800+昇腾910B混合架构
神州数码:深度绑定英伟达中国区代理,保障Deepseek海外芯片供应链安全
润建股份:运维Deepseek华南超算中心,年服务合同金额超5亿元
云赛智联:为Deepseek搭建政务大模型专用云,已落地15个省级智慧城市项目
东方国信:联合Deepseek开发工业大模型,中标宝钢智能炼钢项目
科大讯飞:与Deepseek共建教育大模型生态,共享超1000万小时语音数据
三六零:参股Deepseek母公司20%股权,共建网络安全大模型
同方股份:为Deepseek部署液冷智算中心,PUE值压至1.08
中国长城:供应Deepseek信创服务器主板,国产化率突破90%
景嘉微:JM9系列GPU通过Deepseek适配认证,进入备选供应链
寒武纪:思元590芯片完成Deepseek框架适配,算力密度提升40%
紫光股份:新华三交换机承载Deepseek 80%数据中心流量
中际旭创:800G光模块批量供应Deepseek北美算力节点
新易盛:CPO硅光方案通过Deepseek验证,能耗降低35%
天孚通信:独家供应Deepseek光引擎组件,单月出货量破10万只
工业富联:代工Deepseek定制AI服务器机柜,良品率99.99%
中贝通信:运维Deepseek西北算力中心,储备1500P异构算力

资讯解析

行业:
人工智能
标的:
拓维信息 鸿博股份 中科曙光 浪潮信息 神州数码 润建股份 云赛智联 东方国信 科大讯飞 三六零 同方股份 中国长城 景嘉微 寒武纪 紫光股份 中际旭创 新易盛 天孚通信 工业富联 中贝通信
标签:
DeepSeek R2 Hybrid MoE 3.0 昇腾910B 多模态 国产替代 科技 AI算力 大模型 DeepSeek R2技术突破 昇腾生态 AI服务器 光模块
摘要:
DeepSeek R2在模型架构、数据工程、硬件适配三大领域实现突破,并在多模态应用层取得技术迭代,相关供应链企业受益。
多方:
DeepSeek R2的技术突破将推动AI算力需求增长,相关供应链企业订单增加,业绩有望提升。国产替代趋势下,昇腾生态和国产服务器厂商将迎来发展机遇。
空方:
技术突破的实际商业化应用仍需时间验证,且AI行业竞争激烈,相关企业可能面临技术迭代风险和市场份额争夺压力。