|
|
最近又看到好几家机构放出了最新一期的国产大模型排行榜,说实话,作为一路看着国内AI圈从百模大战卷到现在的老网民,我现在看这些榜单已经有点脱敏了。每个月总有那么几天,某家厂商突然发篇文章说自己全面超越GPT-4,跑分遥遥领先。但跑分这东西,懂的都懂,刷榜已经成了公开的秘密。所以今天咱们不看跑分,就聊聊这大半年来,真正在日常使用中跑出来的几个头部选手。
先说现在风头最盛的DeepSeek。这绝对是今年最大的黑马,没有之一。以前大家都觉得开源模型就是陪跑的,但DeepSeek硬生生把价格打下来了,而且能力确实顶。特别是写代码和做逻辑推理的时候,那种一气呵成的感觉,真的不输给国外的顶级模型。现在我们群里几个搞开发的,基本人手一个DeepSeek API,便宜量大管饱。它能在榜单上霸榜,靠的是真本事,不是营销。
再说说Kimi。Kimi的火是另一种路线,它不跟你拼代码,拼的是长文本和日常阅读。虽然最近因为用户太多,经常出现服务器崩盘、响应变慢的问题,被大家戏称为“小破球”,但不得不承认,扔给它一份几百页的PDF或者长篇财报,它总结出来的东西确实是最接近人类阅读习惯的。对于不写代码的普通打工人来说,Kimi现在的用户黏性绝对是第一档的,很多人每天上班第一件事就是打开Kimi网页版。
当然,老牌大厂的实力也不能忽视。阿里的通义千问现在真的是稳扎稳打,尤其是开源的那几个版本,海外口碑好得离谱。感觉阿里现在走的是全能路线,不管你问什么,它都能给你一个中规中矩且没啥大错的回答,属于那种“闭眼用不会出错”的类型。智谱的GLM也差不多,虽然声量不如前两家大,但在企业端落地做得很好,是个闷声发大财的主儿。
至于百度文心一言、腾讯混元还有字节的豆包,感觉就有点各自为战的意思了。文心一言起步最早,但总感觉后劲不足,产品体验一直差点意思;混元主要还是依托腾讯自家的生态,微信QQ里用着方便,但单独拿出来用的人不多;豆包倒是靠字节强大的流量分发拿下了巨大的C端用户量,但硬核玩家普遍觉得它有点“傻白甜”,更适合做娱乐陪伴而不是严肃办公。
所以,看来看去,现在的国产大模型格局早就不是当初那种“谁喊得响谁第一”的阶段了。榜单上的第一换个不停,今天你超我,明天我超你,其实意义不大。真正的排名在每个用户的日常工作流里。对于我个人而言,写代码和查资料用DeepSeek,看长文档用Kimi,兜底用通义千问,这套组合拳打下来,基本能覆盖百分之九十的需求了。与其去争论谁才是国产第一,不如多去试试这几家免费的模型,毕竟小孩子才看跑分,成年人只看好不好用。 |
|