MiniMax

3个月前更新 922 00

集视频、语音、大模型于一体的高性价比AI全家桶。

收录时间：

2026-04-07

MiniMax，中文名稀宇科技，2021年底成立于上海，创始团队是从商汤出来的一帮计算机视觉研究员。早期拿了米哈游的投资，后来阿里领投了6亿美金，腾讯、红杉、高瓴也都进来了。2026年1月9号在港交所上市，2025年全年营收同比涨了159%。

MiniMax现在已经成为了一款全栈式的AI平台。文本、视频、语音、音乐，全都做了，而且每一块都不是凑数的。

文本模型这边，最新的是MiniMax-M2.7，往前还有M2.5、M2.1、M2。M2.7比较有意思的一点是，它在训练过程中用了「自我进化」的机制，就是用早期版本的模型来搭建训练环境、管理数据流水线、甚至优化评估指标。说得通俗点，就是AI在帮AI变强。这听着有点科幻，但它确实在SWE-bench这些实战型的编程基准测试上拿到了不错的分数。API价格也很有竞争力，输入token 0.3美元/百万，输出token 1.2美元/百万，大概是Claude Sonnet价格的8%左右。

这个价格，你想想看，如果你是一个独立开发者或者小团队，想跑一些Agent任务，想做代码辅助，这个成本差距是真的很大的。

视频这块，就是大家可能更熟悉的海螺AI（Hailuo AI）。最新的版本是Hailuo 2.3，主打的是物理动作的精确度和风格化表现。我自己试了一下，给它一张静态的人像照片加一段提示词，让人物做一个转头微笑的动作，出来的效果，怎么说呢，面部微表情的过渡确实比很多同类工具自然很多。嘴角的弧度、眼神的变化，不是那种僵硬的「AI感」。

而且它现在有一个叫Media Agent的东西，你输入内容，它自动匹配合适的多模态模型，图片、视频、音频一条龙给你搞定。对于做短视频内容的创作者来说，这个工作流确实省了不少事。

语音方面，Speech 2.6支持30多种语言的文本转语音，情感表达这块做得不错。我没有深度测过所有语言，但中英文的效果听起来确实比较「活」，不是那种机器人念稿的感觉。

还有一个很多人不知道的，它有音乐生成。Music 2.5+，能做纯音乐，支持各种风格。我自己还没怎么用过这块，但看社区里一些创作者的作品，质量是真的可以的。

MiniMax Agent

MiniMax现在面向普通用户的主要入口是MiniMax Agent。你可以把它理解成一个全能型的AI助手，但跟普通的ChatBot不一样的地方在于，它不是单纯的一问一答。它会把你的任务拆成子任务，分配给不同的「子Agent」来协作完成。比如你让它帮你做一个调研报告，它可能会同时启动搜索、分析、写作几个模块，最后整合成一个完整的输出。

暂无评论

暂无评论...

MiniMax

MiniMax Agent

相关导航

腾讯元宝

万相

文心一言

Grok

Kimi智能助手

TD Prompts

豆包编程助手

豆包

暂无评论

加入收藏夹

设为首页

网址

Zlibrary

观影GYING

itch.io

七味网

毒蘑菇测试

zhelper search

Ylibrary

台风网

字幕库

pixiv 镜像