韭研

人格化语音时代来了,超越OpenAI、ElevenLabs,新一代语音模型屠榜!

最近AI圈又炸了!国内大模型公司MiniMax扔出"王炸"——新一代语音模型Speech-02直接屠榜国际权威评测,把OpenAI和ElevenLabs两大巨头挤下神坛。这波操作不仅让老外直呼"音频领域要变天",更让人工智能语音正式迈入"以假乱真"的新阶段。

技术狠活:零样本克隆+声音DNA提取
Speech-02的杀手锏在于两大突破:

  1. 零样本克隆:不用提前训练,随便听你5秒录音就能完美复刻你的声音,连背景咳嗽声都能自动过滤,堪称"声音复印机"。

  2. Flow-VAE黑科技:就像给AI装了声纹鉴定仪,能提取说话人的"声音DNA",连语气词、口头禅都不放过,生成效果比某些真人录音还自然。

更离谱的是成本只有竞品的1/4,网友调侃:"这性价比,ElevenLabs看了连夜改PPT。"

实测效果:主播、哭戏、多语种无缝切换

  • 拟人度拉满:预置数百种音色,朗诵《哈姆雷特》能秒变"午夜电台",读苏轼悼亡词可切换"悲痛模式",连呼吸停顿都带着戏。

  • 方言王者:中英日三语混读毫无压力,粤语版《江城子》情感充沛到像TVB演员附体。

  • 声音DIY:用户现在就是导演,上传自拍视频就能让AI用你的声音说外语,还能指定"生气/撒娇"等情绪,堪称社恐人士的社交外挂。

行业地震:AI语音进入人格化时代
MiniMax这波操作直接重新定义行业标准:

  • 打破传统需要1小时录音数据的限制,实现"秒级克隆"

  • 支持32种语言,尤其中文表现碾压国际模型

  • 已落地智能座舱、教育硬件等领域,连玩具熊都能和你唠方言

有科技博主预言:"当AI语音比真人还像真人,主播、客服行业可能迎来大洗牌。"目前海外版已开放体验,国内用户还得再等等。看来在AI赛道,国产模型不仅追上来了,甚至开始领跑——下次听到"像极了本人"的电话推销,可能真得问一句:"你是真人还是AI?"

(想亲自试听效果?官网体验地址:minimax.io/audio/text-to-speech)


相关个股

南天信息:公司控股子公司海捷科技与MiniMax有做基于AI大模型方面的技术研讨,但还未有具体的项目合作落地。

鸿博股份: 海螺AI的母公司minimax提供算力

资讯解析

行业:
人工智能
标的:
南天信息 鸿博股份
标签:
AI语音 MiniMax Speech-02 零样本克隆 声音DNA 科技 大模型 语音克隆 AI语音技术突破 国产AI模型领跑
摘要:
国内大模型公司MiniMax发布新一代语音模型Speech-02,在国际评测中超越OpenAI和ElevenLabs,实现零样本克隆和声音DNA提取两大技术突破,成本仅为竞品的1/4,引发行业震动。
多方:
Speech-02的技术突破标志着国产AI模型的崛起,成本优势和技术领先性可能推动其在全球市场的竞争力。相关个股有望受益于技术合作和市场预期。
空方:
尽管技术突破显著,但MiniMax的Speech-02尚未在国内开放体验,市场推广和商业化进程存在不确定性。相关个股的合作尚未具体落地,短期内的业绩贡献有限。