MiniMax

14小时前更新 21 00

集视频、语音、大模型于一体的高性价比AI全家桶。

收录时间:
2026-04-07

MiniMax,中文名稀宇科技,2021年底成立于上海,创始团队是从商汤出来的一帮计算机视觉研究员。早期拿了米哈游的投资,后来阿里领投了6亿美金,腾讯、红杉、高瓴也都进来了。2026年1月9号在港交所上市,2025年全年营收同比涨了159%。

MiniMax现在已经成为了一款全栈式的AI平台。文本、视频、语音、音乐,全都做了,而且每一块都不是凑数的。

文本模型这边,最新的是MiniMax-M2.7,往前还有M2.5、M2.1、M2。M2.7比较有意思的一点是,它在训练过程中用了「自我进化」的机制,就是用早期版本的模型来搭建训练环境、管理数据流水线、甚至优化评估指标。说得通俗点,就是AI在帮AI变强。这听着有点科幻,但它确实在SWE-bench这些实战型的编程基准测试上拿到了不错的分数。API价格也很有竞争力,输入token 0.3美元/百万,输出token 1.2美元/百万,大概是Claude Sonnet价格的8%左右。

这个价格,你想想看,如果你是一个独立开发者或者小团队,想跑一些Agent任务,想做代码辅助,这个成本差距是真的很大的。

视频这块,就是大家可能更熟悉的海螺AI(Hailuo AI)。最新的版本是Hailuo 2.3,主打的是物理动作的精确度和风格化表现。我自己试了一下,给它一张静态的人像照片加一段提示词,让人物做一个转头微笑的动作,出来的效果,怎么说呢,面部微表情的过渡确实比很多同类工具自然很多。嘴角的弧度、眼神的变化,不是那种僵硬的「AI感」。

而且它现在有一个叫Media Agent的东西,你输入内容,它自动匹配合适的多模态模型,图片、视频、音频一条龙给你搞定。对于做短视频内容的创作者来说,这个工作流确实省了不少事。

语音方面,Speech 2.6支持30多种语言的文本转语音,情感表达这块做得不错。我没有深度测过所有语言,但中英文的效果听起来确实比较「活」,不是那种机器人念稿的感觉。

还有一个很多人不知道的,它有音乐生成。Music 2.5+,能做纯音乐,支持各种风格。我自己还没怎么用过这块,但看社区里一些创作者的作品,质量是真的可以的。

MiniMax Agent

MiniMax现在面向普通用户的主要入口是MiniMax Agent。你可以把它理解成一个全能型的AI助手,但跟普通的ChatBot不一样的地方在于,它不是单纯的一问一答。它会把你的任务拆成子任务,分配给不同的「子Agent」来协作完成。比如你让它帮你做一个调研报告,它可能会同时启动搜索、分析、写作几个模块,最后整合成一个完整的输出。

相关导航

暂无评论

none
暂无评论...