Google的Gemini 1.5 Pro模型刚刚在Chatbot Arena上一鸣惊人

gemini2024-11-07 12:03:52173

先做个广告:需要购买Gemini帐号或代充值Gemini会员,请加微信:gptchongzhi

Google 首次摘下桂冠!

推荐使用Gemini中文版,国内可直接访问:https://ai.gpt86.top 

Google的Gemini 1.5 Pro模型刚刚在Chatbot Arena上一鸣惊人,首次登顶排行榜,打破了GPT-4和Claude的长期垄断!

不得不说,Google是真的憋了个大招啊!

先看排行,Gemini 1.5 Pro以1300分的高分独占鳌头,远超第二名GPT-4o和第三名Claude-3.5。

要知道,之前GPT-4和Claude可是AI界的双子星(其实,Gemini 的中文名就叫双子星!),长期霸占排行榜前两名。现在Google 终于出手,直接把他俩挤到了二三名,简直就是AI界的"新皇登基"啊!

不仅如此,Gemini 1.5 Pro还在视觉任务的排行榜上也拿下了第一名。这波操作,可以说是全面开花了。

看到这里,有细心的网友肯定会问:"这个Gemini 1.5 Pro是从哪冒出来的?"

其实这是Google最近刚放出来的一个实验版本(0801),目前正在Google AI Studio和Gemini API上进行早期测试和反馈收集。

也就是说,这个"新皇"其实还是个"Beta版"呢!这就更恐怖了,Beta版就能打趴下其他成熟模型,要是正式版出来,会不会更不得了?

先汇总快速过目Gemini 1.5 Pro(0801)在各个类别的排名:

  • 总体:第1名

  • 数学:第1-3名

  • 指令跟随:第1-2名

  • 编程:第3-5名

  • 硬核提示(英语):第2-5名

这成绩单可算是全A+啊!不愧是Google DeepMind的心血之作。

有细心的网友发现,Gemini团队似乎很喜欢用"1.5"这个数字。有人调侃道:

"看来Google是想告诉我们,1.5比2.0更香?"

也有人猜测:

"会不会是想暗示自己只用了一半的实力就干掉了对手?"

来看看Gemini 1.5 Pro的具体表现。

首先是多语言能力,这可以说是它的一大亮点。

可以看出,Gemini在中文、日语、德语、俄语等语言上都拿下了第一名。这说明什么?说明Google这次是真的下了大功夫,"全球化"可不是说说而已。

国内玩家们也算是迎来了点好消息,如果你能体验到的话。

再来看看技术领域的表现:

在数学、指令遵循、编码等技术领域,Gemini 1.5 Pro也都表现不俗,基本上都能排进前三。尤其是在数学和指令遵循方面,更是稳坐前二

不过,在编码困难提示方面,Claude 3.5 Sonnet、GPT-4o和Llama 405B还是占据了优势。看来Google还是有些"短板"需要补齐。

最后,来看看整体的胜率对比:

Gemini 1.5 Pro (0801)对阵GPT-4o的胜率是54%,对阵Claude-3.5-Sonnet的胜率更是高达59%。这数据一出来,可以说是相当亮眼了。

有网友忍不住调侃道:

"Google这是要搅动AI江湖啊!OpenAI和Anthropic要小心了,新的'天下第一'要易主了!"

也有技术大佬分析说:

"Gemini的表现确实出色,尤其是在多语言方面。但在一些高难度技术任务上还有提升空间。不过考虑到这只是Beta版,潜力巨大。期待正式版的表现!"

Google AI Studio的产品负责人Logan Kilpatrick表示:

这个模型是一个实验性的预览版本,仅供开发者反馈和测试,更多更新即将到来 :)

啊这...所以说这是个半成品

实验版本就能有这样的表现,足以让竞争对手坐立不安了。OpenAI和Anthropic估计已经开始加班加点了吧?

有网友戏称:

"Sam Altman:今晚别睡了,我们得讨论讨论GPT-5了。"

"Dario Amodei:Claude,你怎么能输给一个1.5呢?"

如果你想亲自体验一下这个"新皇"的实力,可以去Google AI Studio上试试。不过要注意,目前只有最新版本的Gemini才支持这个实验版本哦!

相关链接

[1] 原文链接: https://twitter.com/infwinston/status/1819051404113441003

代充值chatgpt plus

本文链接:https://google-gemini.cc/gemini_100.html

Gemini Ultra与GPT-4对比谷歌上线gemini演示谷歌gemini免费谷歌gemini ai谷歌最强模型gemini登场谷歌gemini发布ai大模型继续狂飙谷歌gemini免费吗gemini谷歌硬件gemini和谷歌谷歌gemini如何下载

相关文章