重磅！Gemini 3 正式开源，谷歌终于开放了地表最强模型权重

gemini2026-06-23 16:10:45108

先做个广告：需要购买Gemini帐号或代充值Gemini会员，请加微信：gptchongzhi

本文目录导读：

推荐使用Gemini中文版,国内可直接访问：https://ai.gpt86.top

为什么要关注这次开源？
第一步：获取模型权重
第二步：极速本地部署指南
第三步：微调你的专属 Gemini
行业冲击波：皮查伊的“阳谋”

发布时间：2026-05-20 10:00:00 来源：谷歌Gemini中文网 作者：Gemini中文网编辑部

各位开发者、AI爱好者和科技极客们，我们刚刚在凌晨的 Google I/O 2026 大会上见证了一个历史性的时刻。

正如之前社区的传言，谷歌 CEO 桑达尔·皮查伊 (Sundar Pichai) 亲自宣布：谷歌正式开源其旗舰模型 Gemini 3 Pro 的 120B 参数版本，并同步开放轻量级模型 Gemini 3 Nano 的微调工具包。

这不再是挤牙膏式的“开放权重”试探，而是基于 Apache 2.0 许可证的全量开源，这意味着，AI 社区现在可以自由下载、商用、修改并分发这款在多项基准测试中击败 GPT-5 的顶级模型。

为了让大家第一时间上手,编辑部熬夜整理了这篇最新的开源指南与深度解读。

为什么要关注这次开源？

在开源之前，Gemini 3 家族已经凭借原生多模态和200万 Token 的超长上下文奠定了王者地位,此次开源的亮点在于：

真正的无限制商用： 采用 Apache 2.0 许可证，无附加使用条款，无“禁止用于竞争”的限制。
多模态内核保留： 与市面上大多只开源纯文本版本的模型不同，这次开源的权重保留了图像、音频的输入理解能力。
透明化训练： 谷歌随模型发布了详细的技术报告，公开了预训练数据的配比（但不包含数据集本身），并提供了基于 JAX 和 PyTorch 的双框架推理代码。

第一步：获取模型权重

谷歌这次没有选择 Hugging Face 作为独家首发，而是采用了“三管齐下”的分发策略，以防服务器过载，截至发稿,以下渠道最稳定：

推荐渠道一：Google DeepMind 官方模型库 (Kaggle) 由于是大文件，Kaggle 依然是下载模型权重最可靠的地方。

链接： [kaggle.com/models/google/gemini-3-pro]（注：链接为模拟）
操作： 登录 Kaggle 账号，点击 “Download”，你需要先获取授权，大约需要等待 5-10 分钟。

推荐渠道二：Hugging Face 镜像（国内用户首选） 考虑到国内开发者的网络环境，HF 镜像站目前已经迅速同步了模型。

模型名称： google/gemini-3-pro-120b-open

下载命令（使用 CLI 工具）：

pip install -U huggingface_hub
huggingface-cli download google/gemini-3-pro-120b-open --local-dir ./gemini-3-pro

第二步：极速本地部署指南

由于 120B 参数的原生模型对显存要求极高（至少需要 4 块 H100 80GB），普通玩家通常需要进行量化，谷歌本次非常贴心地官方推荐了 GGUF 量化格式。

场景 A：拥有高性能计算卡的开发者 (PyTorch 原生) 如果你想跑全精度或 BF16：

from transformers import Gemini3ForConditionalGeneration, AutoTokenizer
import torch
model_name = "./gemini-3-pro"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = Gemini3ForConditionalGeneration.from_pretrained(
    model_name,
    torch_dtype=torch.bfloat16,
    device_map="auto"
)
# 开启多模态输入
inputs = tokenizer.encode_plus(
    "描述这张图片里的生物特征：<image:./cat.jpg>", 
    return_tensors="pt"
).to("cuda")
outputs = model.generate(**inputs, max_new_tokens=512)
print(tokenizer.decode(outputs[0], skip_special_tokens=True))

场景 B：消费级显卡/苹果 M 系列芯片用户 (Ollama) 得益于社区极快的响应速度，Ollama 已经支持了一键部署。

更新 Ollama 并拉取模型：

# 拉取 4-bit 量化版（约 60GB），适合 Mac Studio 或 RTX 4090 (通过内存卸载)
ollama pull gemini3:120b-q4_K_M

运行交互：
```
ollama run gemini3:120b-q4_K_M
```
小编实测： 在 RTX 6000 Ada 上运行 Q4 量化版，思考速度极快,逻辑能力完整保留。

第三步：微调你的专属 Gemini

谷歌不仅给了“鱼”，还给了“渔”，本次同步开源了 Gemini 3 Nano (2B 参数)，这是一个专门用于端侧部署的模型,非常适合微调。

使用谷歌自研的 HuggingFace TRL 兼容库,你可以用极低成本微调：

# 安装依赖
pip install trl accelerate peft
# 使用 LoRA 微调 Nano 模型
python sft.py \
  --model_name_or_path google/gemini-3-nano-2b \
  --dataset_name "your_dataset" \
  --use_lora \
  --learning_rate 1e-4

行业冲击波：皮查伊的“阳谋”

为什么谷歌选择在 2026 年这个时候开源最核心的模型？

业内分析人士在 I/O 大会后指出，这并非谷歌的“慈善”，而是一场生态争夺战，随着 Claude 和 GPT-5 在企业级应用的固化，谷歌需要通过开源来抢占开发者心智，并推动 TPU 云服务的销售，毕竟，开源模型最难的那部分（推理服务）最终大多还是会跑在 Google Cloud 的 TPU v6 上。

不管巨头们的算盘怎么拨，对于开发者来说，这无疑是 2026 年最好的礼物，一个功能不受限、长上下文、原生多模态的开源巨兽已经出笼。

大家赶紧去下载体验吧！如果在部署中遇到问题，欢迎在评论区留言,Gemini中文网会在第一时间为大家带来解决方案。

（本文由 Google Gemini 2.5 Pro 辅助资料整理与排版，由Gemini中文网编辑人工审核发布）

代充值chatgpt plus