先做个广告:需要购买Gemini帐号或代充值Gemini会员,请加微信:gptchongzhi
Google 首次摘下桂冠!
推荐使用Gemini中文版,国内可直接访问:https://ai.gpt86.top
Google的Gemini 1.5 Pro模型刚刚在Chatbot Arena上一鸣惊人,首次登顶排行榜,打破了GPT-4和Claude的长期垄断!
不得不说,Google是真的憋了个大招啊!
先看排行,Gemini 1.5 Pro以1300分的高分独占鳌头,远超第二名GPT-4o和第三名Claude-3.5。
要知道,之前GPT-4和Claude可是AI界的双子星(其实,Gemini 的中文名就叫双子星!),长期霸占排行榜前两名。现在Google 终于出手,直接把他俩挤到了二三名,简直就是AI界的"新皇登基"啊!
不仅如此,Gemini 1.5 Pro还在视觉任务的排行榜上也拿下了第一名。这波操作,可以说是全面开花了。
看到这里,有细心的网友肯定会问:"这个Gemini 1.5 Pro是从哪冒出来的?"
其实这是Google最近刚放出来的一个实验版本(0801),目前正在Google AI Studio和Gemini API上进行早期测试和反馈收集。
也就是说,这个"新皇"其实还是个"Beta版"呢!这就更恐怖了,Beta版就能打趴下其他成熟模型,要是正式版出来,会不会更不得了?
先汇总快速过目Gemini 1.5 Pro(0801)在各个类别的排名:
总体:第1名
数学:第1-3名
指令跟随:第1-2名
编程:第3-5名
硬核提示(英语):第2-5名
这成绩单可算是全A+啊!不愧是Google DeepMind的心血之作。
有细心的网友发现,Gemini团队似乎很喜欢用"1.5"这个数字。有人调侃道:
"看来Google是想告诉我们,1.5比2.0更香?"
也有人猜测:
"会不会是想暗示自己只用了一半的实力就干掉了对手?"
来看看Gemini 1.5 Pro的具体表现。
首先是多语言能力,这可以说是它的一大亮点。
可以看出,Gemini在中文、日语、德语、俄语等语言上都拿下了第一名。这说明什么?说明Google这次是真的下了大功夫,"全球化"可不是说说而已。
国内玩家们也算是迎来了点好消息,如果你能体验到的话。
再来看看技术领域的表现:
在数学、指令遵循、编码等技术领域,Gemini 1.5 Pro也都表现不俗,基本上都能排进前三。尤其是在数学和指令遵循方面,更是稳坐前二。
不过,在编码和困难提示方面,Claude 3.5 Sonnet、GPT-4o和Llama 405B还是占据了优势。看来Google还是有些"短板"需要补齐。
最后,来看看整体的胜率对比:
Gemini 1.5 Pro (0801)对阵GPT-4o的胜率是54%,对阵Claude-3.5-Sonnet的胜率更是高达59%。这数据一出来,可以说是相当亮眼了。
有网友忍不住调侃道:
"Google这是要搅动AI江湖啊!OpenAI和Anthropic要小心了,新的'天下第一'要易主了!"
也有技术大佬分析说:
"Gemini的表现确实出色,尤其是在多语言方面。但在一些高难度技术任务上还有提升空间。不过考虑到这只是Beta版,潜力巨大。期待正式版的表现!"
Google AI Studio的产品负责人Logan Kilpatrick表示:
这个模型是一个实验性的预览版本,仅供开发者反馈和测试,更多更新即将到来 :)
啊这...所以说这是个半成品?
实验版本就能有这样的表现,足以让竞争对手坐立不安了。OpenAI和Anthropic估计已经开始加班加点了吧?
有网友戏称:
"Sam Altman:今晚别睡了,我们得讨论讨论GPT-5了。"
"Dario Amodei:Claude,你怎么能输给一个1.5呢?"
如果你想亲自体验一下这个"新皇"的实力,可以去Google AI Studio上试试。不过要注意,目前只有最新版本的Gemini才支持这个实验版本哦!
相关链接
[1] 原文链接: https://twitter.com/infwinston/status/1819051404113441003
本文链接:https://google-gemini.cc/gemini_100.html
Gemini Ultra与GPT-4对比谷歌上线gemini演示谷歌gemini免费谷歌gemini ai谷歌最强模型gemini登场谷歌gemini发布ai大模型继续狂飙谷歌gemini免费吗gemini谷歌硬件gemini和谷歌谷歌gemini如何下载