最近AI圈又炸了!国内大模型公司MiniMax扔出"王炸"——新一代语音模型Speech-02直接屠榜国际权威评测,把OpenAI和ElevenLabs两大巨头挤下神坛。这波操作不仅让老外直呼"音频领域要变天",更让人工智能语音正式迈入"以假乱真"的新阶段。
技术狠活:零样本克隆+声音DNA提取
Speech-02的杀手锏在于两大突破:
零样本克隆:不用提前训练,随便听你5秒录音就能完美复刻你的声音,连背景咳嗽声都能自动过滤,堪称"声音复印机"。
Flow-VAE黑科技:就像给AI装了声纹鉴定仪,能提取说话人的"声音DNA",连语气词、口头禅都不放过,生成效果比某些真人录音还自然。
更离谱的是成本只有竞品的1/4,网友调侃:"这性价比,ElevenLabs看了连夜改PPT。"
实测效果:主播、哭戏、多语种无缝切换
拟人度拉满:预置数百种音色,朗诵《哈姆雷特》能秒变"午夜电台",读苏轼悼亡词可切换"悲痛模式",连呼吸停顿都带着戏。
方言王者:中英日三语混读毫无压力,粤语版《江城子》情感充沛到像TVB演员附体。
声音DIY:用户现在就是导演,上传自拍视频就能让AI用你的声音说外语,还能指定"生气/撒娇"等情绪,堪称社恐人士的社交外挂。
行业地震:AI语音进入人格化时代
MiniMax这波操作直接重新定义行业标准:
打破传统需要1小时录音数据的限制,实现"秒级克隆"
支持32种语言,尤其中文表现碾压国际模型
已落地智能座舱、教育硬件等领域,连玩具熊都能和你唠方言
有科技博主预言:"当AI语音比真人还像真人,主播、客服行业可能迎来大洗牌。"目前海外版已开放体验,国内用户还得再等等。看来在AI赛道,国产模型不仅追上来了,甚至开始领跑——下次听到"像极了本人"的电话推销,可能真得问一句:"你是真人还是AI?"
(想亲自试听效果?官网体验地址:minimax.io/audio/text-to-speech)
相关个股:
南天信息:公司控股子公司海捷科技与MiniMax有做基于AI大模型方面的技术研讨,但还未有具体的项目合作落地。
鸿博股份: 海螺AI的母公司minimax提供算力