Google的Gemini 1.5 Pro模型刚刚在Chatbot Arena上一鸣惊人

gemini2025-05-02 17:19:18689

先做个广告：需要购买Gemini帐号或代充值Gemini会员，请加微信：gptchongzhi

Google 首次摘下桂冠！

推荐使用Gemini中文版,国内可直接访问：https://ai.gpt86.top

Google的Gemini 1.5 Pro模型刚刚在Chatbot Arena上一鸣惊人，首次登顶排行榜，打破了GPT-4和Claude的长期垄断！

不得不说，Google是真的憋了个大招啊！

先看排行，Gemini 1.5 Pro以1300分的高分独占鳌头，远超第二名GPT-4o和第三名Claude-3.5。

要知道，之前GPT-4和Claude可是AI界的双子星（其实，Gemini 的中文名就叫双子星！），长期霸占排行榜前两名。现在Google 终于出手，直接把他俩挤到了二三名，简直就是AI界的"新皇登基"啊！

不仅如此，Gemini 1.5 Pro还在视觉任务的排行榜上也拿下了第一名。这波操作，可以说是全面开花了。

看到这里，有细心的网友肯定会问："这个Gemini 1.5 Pro是从哪冒出来的？"

其实这是Google最近刚放出来的一个实验版本（0801），目前正在Google AI Studio和Gemini API上进行早期测试和反馈收集。

也就是说，这个"新皇"其实还是个"Beta版"呢！这就更恐怖了，Beta版就能打趴下其他成熟模型，要是正式版出来，会不会更不得了？

先汇总快速过目Gemini 1.5 Pro（0801）在各个类别的排名：

这成绩单可算是全A+啊！不愧是Google DeepMind的心血之作。

有细心的网友发现，Gemini团队似乎很喜欢用"1.5"这个数字。有人调侃道：

"看来Google是想告诉我们，1.5比2.0更香？"

也有人猜测：

"会不会是想暗示自己只用了一半的实力就干掉了对手？"

来看看Gemini 1.5 Pro的具体表现。

首先是多语言能力，这可以说是它的一大亮点。

可以看出，Gemini在中文、日语、德语、俄语等语言上都拿下了第一名。这说明什么？说明Google这次是真的下了大功夫，"全球化"可不是说说而已。

国内玩家们也算是迎来了点好消息，如果你能体验到的话。

再来看看技术领域的表现：

在数学、指令遵循、编码等技术领域，Gemini 1.5 Pro也都表现不俗，基本上都能排进前三。尤其是在数学和指令遵循方面，更是稳坐前二。

不过，在编码和困难提示方面，Claude 3.5 Sonnet、GPT-4o和Llama 405B还是占据了优势。看来Google还是有些"短板"需要补齐。

最后，来看看整体的胜率对比：

Gemini 1.5 Pro (0801)对阵GPT-4o的胜率是54%，对阵Claude-3.5-Sonnet的胜率更是高达59%。这数据一出来，可以说是相当亮眼了。

有网友忍不住调侃道：

"Google这是要搅动AI江湖啊！OpenAI和Anthropic要小心了，新的'天下第一'要易主了！"

也有技术大佬分析说：

"Gemini的表现确实出色，尤其是在多语言方面。但在一些高难度技术任务上还有提升空间。不过考虑到这只是Beta版，潜力巨大。期待正式版的表现！"

Google AI Studio的产品负责人Logan Kilpatrick表示：

这个模型是一个实验性的预览版本，仅供开发者反馈和测试，更多更新即将到来 :)

啊这...所以说这是个半成品？

实验版本就能有这样的表现，足以让竞争对手坐立不安了。OpenAI和Anthropic估计已经开始加班加点了吧？

有网友戏称：

"Sam Altman：今晚别睡了，我们得讨论讨论GPT-5了。"
"Dario Amodei：Claude，你怎么能输给一个1.5呢？"

如果你想亲自体验一下这个"新皇"的实力，可以去Google AI Studio上试试。不过要注意，目前只有最新版本的Gemini才支持这个实验版本哦！

相关链接