Google Gemini vs ChatGPT:生成式人工智能热潮的真正开始

gemini2025-01-02 00:35:25841

先做个广告:需要购买Gemini帐号或代充值Gemini会员,请加微信:gptchongzhi

Gemini 之于 Google 就像 ChatGPT 之于 OpenAI。然而,它是一个生成式人工智能模型,不仅可以处理文本,还可以处理图像、音频和视频。Gemini 可以通过 Google 的 Bard 聊天机器人访问,是该公司功能最强大的模型,并且被认为更强大、用途更广泛。

另外,AI先行者前沿交流群目前前8个群都已经满员了。刚刚新建了9群,欢迎感兴趣的朋友回复关键词【交流】,扫码入群

🔗Bard链接:https://bard.google.com/

推荐使用Gemini中文版,国内可直接访问:https://ai.gpt86.top 

引言

12月6日,谷歌终于推出了 Gemini——一款期待已久的对标ChatGPT的产品。它是该公司迄今为止规模最大、能力最强的人工智能 (AI) 模型。Gemini能够理解和识别文本、图像、音频等。

Gemini将挑战OpenAI的GPT-4的霸主地位

在微软的财务实力和计算能力的支持下,OpenAI 在去年底发布免费的 ChatGPT 工具时,已经深入开发其最先进的人工智能模型 GPT-4。这个由人工智能驱动的聊天机器人迅速享誉全球,为生成式人工智能的商业前景带来了热议,并迫使谷歌推出「Bard」作为回应。

Gemini 是第一个在大规模多任务语言理解(MMLU)基准上超越人类专家的人工智能模型。


自推出以来,Gemini 就被称为「ChatGPT 杀手」,在所有测试中都击败了 OpenAI 的对话界面,除了「HellaSwag」之外,「HellaSwag」被描述为「日常任务的常识推理」。

Gemini 在多项测试中的分数远超GPT-4
Gemini 旨在以与人类相同的方式了解我们周围的世界,与其他人工智能模型相比,具有更广泛的功能和更好的性能。谷歌CEO桑达尔·皮查伊在最近的发布会中这样阐述道。
「我们一直在测试我们新的多模式人工智能模型 Gemini 的功能」,在视频开头的描述写道。
「我们一直在捕捉镜头来测试它在各种挑战中的表现,向它展示一系列图像并要求它推理所看到的内容。」
谷歌DeepMind产品副总裁Eli Collins在新闻发布会上表示,「这是第一个在解决问题、数学、物理、历史、法律、医学和伦理等某些基准方面超越人类专家的人工智能模型」。在名为 MMLU 的多任务测试中得分高达90%,该测试涵盖数学、物理、法律、医学和伦理学等 57 个科目。Ultra 现在将为一种名为 「AlphaCode2」的新代码编写工具提供支持,谷歌声称该工具可以胜过 85% 的竞赛级人类计算机程序员。
在虚拟新闻发布会上,谷歌拒绝透露 Gemini 的参数数量——这是衡量模型复杂性的一个指标,但不是唯一的指标。12月6日发布的一份白皮书概述了Gemini 在多项选择考试、小学数学和其他基准测试中表现优于 GPT-4 的最强大版本,但承认在让 AI 模型实现更高水平的推理技能方面持续存在困难。
一些计算机科学家认为大型语言模型的作用有限,这些模型通过重复预测句子中的下一个单词来工作,并且很容易弥补被称为幻觉的错误。「我们在 Gemini 的所谓事实性方面取得了很大进展。所以Gemini 是我们这方面最好的典范。但我想说,这仍然是一个未解决的研究问题」,谷歌DeepMind产品副总裁Eli Collins说道。
Gemini 带来的全新升级
Gemini 不仅仅是一个单一的人工智能模型。有一个名为Gemini Nano的更轻版本,旨在在 Android 设备上本地离线运行。有一个名为Gemini Pro的更强大版本,它将很快为许多 Google AI服务提供支持,并且从今天开始成为Bard的支柱。还有一个功能更强大的模型,称为 Gemini Ultra,它是 Google 迄今为止创建的最强大的模型,似乎主要是为数据中心和企业应用程序设计的。
总结来说,有以下三种:
  • Ultra:谷歌新的大语言模型最强大、功能最强大的版本。
  • Pro:在Bard中进行微调,以提高其在理解和总结信息、推理、编码和规划方面的性能。
  • Nano:可以在移动设备和数据中心上运行,专为智能手机量身定制。

Gemini的三种不同规模大小的模型
在这些基准测试中,Gemini 最明显的优势来自于它理解视频和音频并与之交互的能力。这很大程度上是设计使然:多模式从一开始就是Gemini计划的一部分。谷歌没有像OpenAI创建DALL-E和Whisper那样训练单独的图像和语音模型;它从一开始就建立了一个多感官模型。「我们一直对非常非常通用的系统感兴趣」,担任Gemini 开发的高管 Demis Hassabis说道。即从任意数量的输入和感官中收集尽可能多的数据,然后给出尽可能多的响应。
目前,Gemini 最基本的模型是文本输入和文本输出,但更强大的模型(如 Gemini Ultra)可以处理图像、视频和音频。Hassabis说,「它会变得更加普遍,仍然有动作和触摸之类的东西——更像是机器人类型的东西」,他说,随着时间的推移,Gemini 将获得更多的感官,变得更有意识,并在这个过程中变得更加准确和扎根。「这些模型只是更好地了解周围的世界」。当然,这些模型仍然存在幻觉,并且仍然存在偏见和其他问题。但Hassabis 说,他们知道的越多,他们就会做得越好。
Gemini 显然是一个效率更高的模型。它是在 Google 自己的张量处理单元上进行训练的,比 Google 之前的模型(如 PaLM)运行速度更快、成本更低。除了新模型之外,谷歌还推出了新版本的 TPU 系统,即 TPU v5p——专门设计用于数据中心训练和运行大型模型的计算系统。

Google的大规模GPU运算中心
上面的视频中演示涉及到实时手绘图像以及手势以及Gemini对此做出理解的讨论。详细介绍了其在逻辑和谜题解决、图像序列分析、魔术技巧解释、记忆和逻辑游戏等方面的能力!
Gemini引发激烈讨论

Gemini 有望成为有史以来最强大的人工智能。它将具有复杂的多模式功能,掌握人类风格的对话、语言和内容,理解和解释图像,大量有效地编码,驱动数据和分析,并被开发人员用来创建新的人工智能应用程序和 API。在不久的将来,Gemini 预计将存在甚至为 Google 的大部分产品和服务提供动力。

Gemini 比 ChatGPT 更强大吗?

在比较 Gemini 和 ChatGPT 时,许多专家都会谈论参数。人工智能系统中的参数是在训练阶段调整或调整其值的变量,人工智能使用这些变量将输入数据转换为输出。从广义上讲,人工智能拥有的参数越多,它就越复杂。

ChatGPT 4.0 是运行中最先进的人工智能,拥有 1.75 万亿个参数。相比之下,Gemini 据报道超过了这个数字——有报道称它将拥有 30 万亿甚至 65 万亿个参数。
SemiAnalysis 的一项研究向我们保证,Gemini 将“粉碎”ChatGPT 4.0。SemiAnalysis 预计,到 2023 年底,Gemini 的性能可能会超过 ChatGPT 4.0 五倍,甚至可能强大 20 倍。

Gemini、芯片和训练数据

ChatGPT 的多模式能力仍然很小——它可以处理语言和代码,但不能处理图像——Gemini 将把这一切结合起来。
SemiAnalysis 补充说,谷歌投入了「前所未有的计算能力」来训练 Gemini,超过了 GPT-4。为了训练 Gemini,谷歌使用了名为 TPUv5 的尖端训练芯片。据报道,这些芯片是世界上唯一能够协调 16,384 个芯片协同工作的技术。这些超级芯片是谷歌能够训练如此庞大模型的秘密。

但训练人工智能模型不仅仅涉及芯片,还涉及数据。在数据方面,谷歌是统治者之一。SemiAnalysis 补充道,「谷歌拥有大量纯代码数据,估计约有 40 万亿 tokens,这一事实已经得到验证」

四十万亿tokens相当于数百拍字节(petabytes)或数百万本书的内容。据 SemiAnalysis 称,「仅 Google 数据集就比用于训练 ChatGPT 4.0 的全部数据(包括代码和非代码数据)大四倍」

Gemini的未来?

就像 PaLM 2为Google 品牌的所有产品提供支持一样,Gemini也有望为 AI 做同样的事情。谷歌正在培育 Gemini,并期望它能够成长为嵌入并集成到每项谷歌产品和服务中的所有人工智能的支柱。

我们将看到哪些由 Gemini 提供支持的最终产品和服务?如果取代 PaLM 2,Gemini 将为从地图到文档和翻译的所有内容、所有 Google Workplace 和云环境和服务,以及软件、硬件和新产品提供支持。

谷歌完全致力于构建一个更强大、更通用、具有情境感知能力的人工智能,能够以前所未有的新方式理解世界并与世界互动。
未来,程序员将使用Gemini进行编码、自动化和增强云和边缘操作,推动销售,并集成到可穿戴 Google 技术智能手机、应用程序、API 等内的聊天机器人和虚拟助手中。

代充值chatgpt plus

本文链接:https://google-gemini.cc/gemini_24.html

Google GeminiChatGPTGoogle Gemini跟ChatGPT对比

相关文章