1
bbbblue 3 天前
跑分的话是 GPT-5 mini 推理 medium 的一些跑分在 minimax m2/qwen3 coder 那一档 你可以搜下 SWE-rebench
|
2
wilddog OP @bbbblue 嗯,评分我知道,主要是问问有没有老哥实际 code 过的,输出的实际能力如何,因为我还看到有人说 Grok code fast 不错,不过我今天试用下来 Grok 一直限流没用成
|
3
codehz 3 天前 via Android
Grok code fast 输出 patch 正确性高(甚至比付费的 codex 还好),但是复杂任务不是很行,raptor mini 是微调的 gpt 5 mini ,能解决一定程度的复杂问题,但速度太慢,用于编写代码不是很稳定,我建议是免费的话就用 raptor 做 plan ,然后 grok 执行计划()
|
5
burnsby 3 天前
我直说了, 哪怕你使用 GP 里面的 Opus 4.5 模型, 它也是个弱智, 我用 OpenSpec 来开发功能, 在完成任务的时候它居然给我任务列表都改掉了
|
6
labubu 3 天前
同问付费里面的哪个好用
|
10
zenfsharp 3 天前
GPT-5 mini 和 Raptor mini 不知道为什么,我这里经常断,回复一半就停了。
我都是简单没有歧义的东西,比如写个 SQL 语句,或者回复一封美式英语邮件,用 GPT-4.1 ; 遇到大任务,切 agent ,用 Opus 4.5 ; 带图片什么的,只能 GPT-4.1 ; 其他非编程问题,GPT-4.1 。 |
11
hailaz 3 天前
|
12
hailaz 3 天前
噢,问的是免费模型,没认真读题我的错。免费那几个感觉都不太行
|
13
Leoking222 3 天前
Grok 真心不建议,如果拿来写代码的话,还不如 gpt
|
14
maolon 3 天前
都不怎么样,用这些还不如直接用国产模型(自己接 api ),现在国产这些不是在搞活动 coding plan 20 块一个月?
|
15
sagnitude 3 天前
别浪费时间,如果效果达不到,反复问答太浪费时间了,返工更是
|
18
wu67 3 天前 via Android
我只用 gpt4.1 和 claude4.5 系列
|
19
ghm2mail 3 天前
闲鱼 9 块 9 的 claude 没上车?
|
20
56way 3 天前
免费的都是智障不值得浪费时间,直接 pro 付费模式。。一个月 40 刀。。
|
21
yzongyue 3 天前
我免费的用 Grok Code Fast 1 , 感觉比其他的效果好还快
|
22
Msxx 3 天前
真就不考虑 codex 或 gemini 吗?
|
23
gadfly3173 3 天前 via Android
@Msxx 这俩都不能原生运行,要用的话一定会污染自己的全局依赖,还不如隔壁 cc 呢
|
24
bytesfold 3 天前 via iPhone
你们写的东西很复杂吗,我直接说需求,10 轮对话完成,5 轮对话修 bug 和格式就好了
|
25
Zy143L 3 天前
可以考虑多找几个号...我自己用 haiku 速度很好 sonet 那个老断
|
26
COW 3 天前 via Android
调研问问题,我直接用网页 gpt 。稍微复杂点的用 raptor mini 。一小段代码比如一两个函数之类的,用 grok code fast 。gpt 开始还行,用多了就容易降智。付费里 0.33x 那个性价比最高。
|
33
AoEiuV020JP 2 天前
单文件编辑我会用用 GPT-4o ,其他都是废物, 远不如 1/3 倍率的 claude haiku 4.5,
|