V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
mogutouer
V2EX  ›  程序员

MiniMax-M2.7-highspeed 模型真的一般般

  •  
  •   mogutouer · 15 小时 43 分钟前 · 2127 次点击
    昨天要增加一个新功能,改动比较多,尤其是前端。
    于是我用 opus4.6 让 superpowers:brainstorming 开始规划,他分析所有相关不相关的文件,最后整理出一个非常详细的开发设计,以及开发任务,每个大任务还分了几个小任务,任务里都有改哪些文件改什么地方怎么改怎么验证,只需要照着任务指引做就行了。

    前段时间因为玩龙虾,开了 minimax 那个 98 的极速版 token plan 。

    然后我想着任务都规划的这么细了,让 MiniMax-M2.7-highspeed 干一干试试呗。

    晚上 10 点开始,我想着改动也不大就十几个文件,搞一个来小时绝对可以了吧,于是切到 minimax ,开启 agent team 开干。开始感觉还挺好,十几个 agent 五颜六色的在跑,各种开发各种 review ,我心想国产大模型也没他们说的那么不堪嘛,好赖有个平替,以后 opus 规划,minimax 执行好像也挺不错。

    框框不到一个小时任务全跑完了,给我报告说所有任务都完成了。

    于是我就打开测试一下,后端除了数据库没导入,有些字段类型错误,也没啥问题,花了十几二十分钟来回对话他给修好了,API 没问题了,毕竟接口调整不大就改几个返回格式。

    问题出在前端,前端需要增加一个侧滑抽屉,兼容 H5 和 APP 以及 PC 端,滑出来的位置总是不对,内容滑动和多平台兼容也有问题,然后还有很多大小位置滑动显示等等问题,完全没法用。

    于是我就跟他说有什么什么问题,然后他哼哧哼哧改,如此反复又反复对话光是我给他说问题就用了将近 100M 的 tokens

    上头了,最后折腾到凌晨快 2 点还是一堆问题。

    实在顶不住了,git 重置,切到 sonnet 不到半个小时完美完成任务,几个小问题对话了几次就搞定了。

    最后发布上线,折腾到凌晨 3 点。

    第二天直接买 VPS 固定 IP ,新卡新号升级到 claude max ,要不是最近大封号,我之前的被封了,然后试了一大堆中转站体验实在一般般,并且最近封号很多都不能用或者是逆向的,都不会想到要折腾这国产模型。

    总结就是,跑分多牛逼都没用,任务分的多细都没用,因为最终执行是靠模型能力去执行的,不要想着 opus 做规划国产模型来执行,这条路行不通的。我之前还测试 claude 开发完,让国产模型( k2.5 )去跑测试,测都测不明白,按钮外到姥姥家了跟我报告说 UI 测试通过还跟我说非常整齐。

    截止到今天,真正的生产力,现在唯二的选择还是 cluade ( opus,sonnet )和 codex ( gpt5.4 ),大家还是克服困难想尽办法用上 claude 。其他大家试都不用试了,纯浪费时间浪费精力,一个月多花一千几百大家多睡几个好觉吧。

    27 条回复    2026-03-25 18:51:17 +08:00
    imik
        1
    imik  
       15 小时 37 分钟前
    幸亏没手贱花几十块钱试一下
    weixiaoyun
        2
    weixiaoyun  
       15 小时 30 分钟前
    op 图中是什么软件统计的?
    onedge
        3
    onedge  
       15 小时 29 分钟前
    实测不如 m2.5 的智力,我感觉 2.7 路子走偏了,太往工具链方向了,计划,复盘,疑难杂症攻坚能力真的不如 m2.5 我已经用回 2.5 (做执行和日常非编程任务)了
    mogutouer
        4
    mogutouer  
    OP
       15 小时 29 分钟前
    @weixiaoyun #2 ccusage 统计的数据,写了个 chrome 插件方便自己看
    onedge
        5
    onedge  
       15 小时 26 分钟前
    可以试试我自己 vibe 的工具,实时对话 review ,没办法消除但可以降低一定的幻觉,总体上对输出是有提升的
    https://github.com/timwuhaotian/the-pair
    欢迎 contribute
    wengjin456123
        6
    wengjin456123  
       15 小时 23 分钟前
    我基本全用 codex + copilot pro+的 claude 模型,kimi2.5 + GLM 用来打辅助任务,国产执行力 kimi 和 glm 好一点,minimax 模型太小
    ktyang
        7
    ktyang  
       15 小时 18 分钟前
    vps 固定 ip 搭梯子么?还是什么其他的防风操作?
    kanchi240
        8
    kanchi240  
       15 小时 3 分钟前
    @mogutouer 卡在支付,请问 OP 是什么法子
    KisekiRemi
        9
    KisekiRemi  
       14 小时 59 分钟前
    确实如此,刚好你说的都用过,体感一致(笑)
    Tzu
        10
    Tzu  
       14 小时 56 分钟前
    @wengjin456123 能细说下怎么个操作流程吗
    cokey
        11
    cokey  
       14 小时 54 分钟前   ❤️ 1
    MiniMax 2.5 就是蒸馏版 Claude 4.5 sonnet ,本来就更弱
    MiniMax 2.7 就是 2.5 的基础上加了点 工具链 的训练数据搞出来的,智商没有提升
    mogutouer
        12
    mogutouer  
    OP
       14 小时 31 分钟前
    @kanchi240 #8 走 appstore 礼品卡
    @ktyang #7 固定 ip ,设好规则,对 claude 所有服务都走这个 IP ,目前用了大概一周还没封
    leegradyllljjjj
        13
    leegradyllljjjj  
       12 小时 31 分钟前
    有没有便宜量大的
    JoeDH
        14
    JoeDH  
       11 小时 46 分钟前
    国产最强的就是 kimi k2.5 ,但是经过 cursor 用大量的用户数据 RL 训练出来的 composer 2 比 claude opus 4.6 还弱一点,国产模型提升空间还很大
    ProphetN
        15
    ProphetN  
       11 小时 44 分钟前
    230B 的总参数,10B 的激活参数。这模型有尝试的必要?
    gosidealone
        16
    gosidealone  
       11 小时 40 分钟前
    @JoeDH kimi2.5 比 glm5 强吗
    yanguangs
        17
    yanguangs  
       11 小时 20 分钟前
    用了 3 天, 实际效果明显不如 minimax m2.5

    轴的厉害, 已经到我都知道原因, 只是懒得写代码,直接知道模型去写

    笨到累心的程度.
    Sezxy
        18
    Sezxy  
       11 小时 10 分钟前
    你就说它快不快吧
    qxmqh
        19
    qxmqh  
       10 小时 35 分钟前
    请用真 AI 。 国内这帮没有一个能打的,kimi2.5 也是个半吊子。国内这帮 各种分数排名高高的,真实使用起来简直无语。全是假的。
    maoqiucute
        20
    maoqiucute  
       10 小时 33 分钟前
    信国产模型的这辈子有了
    jeeyong
        21
    jeeyong  
       10 小时 24 分钟前
    我是冲着 100t/s 去的. 极速 plus 版, 199 那个.
    实际后半夜,大约在 80-90t/s
    晚上 6-8 点在 60t/s
    我发现全网没有测试他速度的人啊...就是是否真的能到 100t/s
    mogutouer
        22
    mogutouer  
    OP
       10 小时 15 分钟前
    @jeeyong #21 速度快是真的,但没有 sonnet 快,速度快有啥用呢
    ggBalloon
        23
    ggBalloon  
       9 小时 19 分钟前
    固定是什么 IP ?机房 IP ?
    nabanbaba
        24
    nabanbaba  
       9 小时 13 分钟前
    想着跑 openclaw ,弄个国产模型 codingplan 去跑。有推荐的吗。。。
    mogutouer
        25
    mogutouer  
    OP
       8 小时 38 分钟前   ❤️ 1
    @ggBalloon #23 机房的,已经第四天了,没啥事,手机号,账号注册 IP ,手机登录,appstore 账号,都在一个国家,应该没事
    ggBalloon
        26
    ggBalloon  
       7 小时 58 分钟前
    @mogutouer #25 6 手机号都能搞到
    106npo
        27
    106npo  
       7 小时 55 分钟前 via Android
    @jeeyong 这个速度是从首 token 开始算的,但它不保证首 token 啥时候出来 🤣 只要不返回首 token 就没开始算速度
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   1056 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 22ms · UTC 18:47 · PVG 02:47 · LAX 11:47 · JFK 14:47
    ♥ Do have faith in what you're doing.