是的，谷歌已经正式公布了其下一代人工智能模型 Gemini

gemini2026-05-20 02:25:32397

先做个广告：需要购买Gemini帐号或代充值Gemini会员，请加微信：gptchongzhi

谷歌正式发布了其下一代人工智能模型 Gemini，该模型被设计为原生多模态，能够无缝理解和组合文本、图像、音频、视频及代码等不同类型的信息，Gemini 包含 Ultra、Pro 和 Nano 三个版本，分别针对高度复杂任务、通用任务和设备端高效部署进行了优化，在多项基准测试中，其性能超越了人类专家及现有顶尖模型，标志着谷歌在迈向通用人工智能的道路上迈出了关键一步。

本文目录导读：

推荐使用Gemini中文版,国内可直接访问：https://ai.gpt86.top

什么是 Gemini？
核心特点：原生多模态
三个版本，面向不同场景
与 Bard 的整合及更名
性能表现

这是一个非常重要的发布，标志着谷歌在人工智能领域迈出了关键一步，以下是关于 Gemini 的核心信息汇总：

什么是 Gemini？

Gemini 是谷歌有史以来规模最大、能力最强、最通用的AI模型，它由谷歌的 DeepMind 和 Google Research 团队联合打造，是一个从设计之初就原生支持多模态的模型。

核心特点：原生多模态

这是 Gemini 最突出的特点，与许多将纯文本、纯视觉、纯音频模型拼接在一起的多模态模型不同，Gemini 从一开始就是用文本、图像、视频、音频和代码等多种类型的数据进行训练的。

这意味着它可以无缝地理解和推理各种输入,并组合输出。

同时理解文本和图像：给它一张菜品的图片，它能识别出食材,并提供食谱。
理解视频和音频：观看一段视频，理解其中的情节、对话和视觉笑话。
生成代码和文本：根据一个网页设计草图，直接生成对应的 HTML/JS 代码。

三个版本，面向不同场景

谷歌将 Gemini 设计为三个尺寸,以在从数据中心到智能手机的各种设备上运行：

Gemini Ultra：能力最强、规模最大的模型，专为处理高度复杂的任务而设计，如科学发现、多步推理等，在多项学术基准测试中，它是第一个在大规模多任务语言理解（MMLU）上超越人类专家的模型。
Gemini Pro：在能力和通用性上取得最佳平衡的模型，适合广泛的任务，它已经通过 API 提供给开发者和企业，也是谷歌 Bard（现已更名为 Gemini）聊天机器人的底层模型。
Gemini Nano：最高效的模型，专为在移动设备等端侧运行而设计，它已经内置在谷歌的 Pixel 8 Pro 手机中，支持录音摘要、Gboard 智能回复等功能。

与 Bard 的整合及更名

Bard 已更名为 Gemini：谷歌将其对话式 AI 助手 Bard 正式更名为 Gemini,以体现其背后强大的模型能力。
推出高级版：谷歌推出了 Gemini Advanced 订阅服务，这是 Google One AI 高级版计划的一部分，订阅后，用户可以使用最强大的 Gemini Ultra 1.0 模型，在处理复杂逻辑、推理、创意协作等任务上能力大幅提升。
移动端应用：谷歌在安卓和 iOS 上推出了专门的 Gemini 应用，用户可以通过文本、语音或图片与 Gemini 互动。

性能表现

在发布时，谷歌公布了一系列基准测试结果，显示 Gemini Ultra 在 32 项广泛使用的学术基准测试中的 30 项上，超越了当时最先进的水平（包括 GPT-4），尤其在 MMLU（大规模多任务语言理解）测试中，Gemini Ultra 的得分率达到了 90.0%,是第一个超过人类专家水平的模型。