AI产品狙击手

专注于大语言模型LLM,文生图模型Stable Diffusion, 视频生成模型等免费AI工具的分享和应用,助你掌握最前沿的AI技术

0%

Kimi视觉推理大模型:差评!

看网上都在吹Kimi的视觉推理大模型,说得神乎其技,可以取代OpnAI 200刀每月的专业版之类的,真有这么厉害吗?这里我们也来快速测试下。

首先,我们来个简单都英语填空题,这种题一般的大模型都能做对,本来就是大语言模型的强项,仅作为最基本验证,它也是没有问题的。

再看第二道题,来个脑筋急转弯,分析推理确实是一大堆的,答案也和预期一样,但是它是实打实的脑筋不转弯都从语言学等角度得出的答案,其实这里在中文语境中用脑筋急转弯思路就能很快得出答案,太阳公公嘛,那太阳肯定是男都啰。况且太阳叫做sun,儿子也读作son,也能得到印证。所以我推定它是不适合做脑筋急转弯的,起码不适合做中文的脑筋急转弯。

下一道数学题,“一口井7米深,有只蜗牛从井底往上爬,白片爬3米,晚上下坠2米。问蜗牛几天能从井里爬出来?”这里要注意解题的关键点是最后一天可能它不会滑下来了。我们看它分析,前几天都没有问题,第四天,白天爬3米,就是到了6米,晚上滑下来2米,到了第4米,第五天,白片爬3米,4+3刚好7米,所以就爬出来了,就不用考虑晚上往下滑了。所以答案是5天就能爬出去。我们看它最终做了一大堆装模作样的推理,最终还是个错误的答案说需要6天;

最后给它个象棋题,问它红方怎样才能最快都将死黑方,这已经很简单的棋局了,看它也是做了一大堆装模作样的推理,最终竟然需要走五步,我哪个天。我们只需要第一步红帅往右一步,黑将没地方跑,必然往后退一步,然后我们红方第二步就是把兵往上推一步,黑将不就将死了吗。

总的来说,我觉得这玩意儿就是那帮玩意儿为了流量吹出来的,盛名之下其实难副啊!感兴趣的大家自己上去玩下吧,最后别忘记给我点赞关注分享!