
Suno
输入一段话,直接吐出一首专业级单曲
简单来说,这是由国内独角兽企业 MiniMax(名之梦)推出的语音大模型。它不是那种冷冰冰的、像导航播报一样的合成音,而是一套追求“人味儿”的声音生成系统。
它的核心能力集中在两个模型上:语音大模型(abab-speech-01)和音乐大模型(abab-music-01)。
市面上很多AI配音虽然语调准,但没“气儿”。MiniMax Audio 解决的就是这个呼吸感的问题:
目前大家体验 MiniMax Audio 最直接的入口就是 “海螺AI”(网页版或App)。在这里,它的语音表现力被发挥到了极致。
比起技术参数,我更看重它在实际生活里能怎么用:
想要玩转 MiniMax Audio,不能只是傻瓜式地输入文字。这里有几个我实测出来的技巧:
如果你在海螺AI里调用语音功能,不要只写“请帮我读这段话”。
MiniMax 的音乐模型在处理人声演唱时,对“唱腔”的模拟非常到位。如果你想做一段转场BGM,可以尝试描述具体的乐器组合,比如“80年代合成器流行乐(Synth-pop),重低音,动感十足”。
说实话,MiniMax 在这波AI浪潮里走得很稳。比起单纯刷榜,他们更在意“表达”。
目前它的语音克隆速度非常快,只需要几秒钟的样本就能模仿出八九分像。但我也得提醒大家,声音太像人也是一把双刃剑,大家在玩的时候一定要注意版权和隐私边界,尤其不要用它去模仿身边人的声音搞恶作剧。
目前的局限: 虽然它在长文本的语气连贯性上已经做得很好了,但在处理一些极其复杂的方言,或者某些需要极强爆发力的配音场景(比如热血动漫的怒吼)时,偶尔还是会有一点点“计算感”。