重磅!Gemini 3 正式开源,谷歌终于开放了地表最强模型权重

gemini2026-06-23 16:10:45108

先做个广告:需要购买Gemini帐号或代充值Gemini会员,请加微信:gptchongzhi

本文目录导读:

推荐使用Gemini中文版,国内可直接访问:https://ai.gpt86.top 

  1. 为什么要关注这次开源?
  2. 第一步:获取模型权重
  3. 第二步:极速本地部署指南
  4. 第三步:微调你的专属 Gemini
  5. 行业冲击波:皮查伊的“阳谋”

发布时间:2026-05-20 10:00:00 来源:谷歌Gemini中文网 作者:Gemini中文网编辑部

各位开发者、AI爱好者和科技极客们,我们刚刚在凌晨的 Google I/O 2026 大会上见证了一个历史性的时刻。

正如之前社区的传言,谷歌 CEO 桑达尔·皮查伊 (Sundar Pichai) 亲自宣布:谷歌正式开源其旗舰模型 Gemini 3 Pro 的 120B 参数版本,并同步开放轻量级模型 Gemini 3 Nano 的微调工具包。

这不再是挤牙膏式的“开放权重”试探,而是基于 Apache 2.0 许可证的全量开源,这意味着,AI 社区现在可以自由下载、商用、修改并分发这款在多项基准测试中击败 GPT-5 的顶级模型。

为了让大家第一时间上手,编辑部熬夜整理了这篇最新的开源指南与深度解读。

为什么要关注这次开源?

在开源之前,Gemini 3 家族已经凭借原生多模态200万 Token 的超长上下文奠定了王者地位,此次开源的亮点在于:

  1. 真正的无限制商用: 采用 Apache 2.0 许可证,无附加使用条款,无“禁止用于竞争”的限制。
  2. 多模态内核保留: 与市面上大多只开源纯文本版本的模型不同,这次开源的权重保留了图像、音频的输入理解能力。
  3. 透明化训练: 谷歌随模型发布了详细的技术报告,公开了预训练数据的配比(但不包含数据集本身),并提供了基于 JAX 和 PyTorch 的双框架推理代码。

第一步:获取模型权重

谷歌这次没有选择 Hugging Face 作为独家首发,而是采用了“三管齐下”的分发策略,以防服务器过载,截至发稿,以下渠道最稳定:

推荐渠道一:Google DeepMind 官方模型库 (Kaggle) 由于是大文件,Kaggle 依然是下载模型权重最可靠的地方。

  • 链接: [kaggle.com/models/google/gemini-3-pro](注:链接为模拟)
  • 操作: 登录 Kaggle 账号,点击 “Download”,你需要先获取授权,大约需要等待 5-10 分钟。

推荐渠道二:Hugging Face 镜像(国内用户首选) 考虑到国内开发者的网络环境,HF 镜像站目前已经迅速同步了模型。

  • 模型名称: google/gemini-3-pro-120b-open
  • 下载命令(使用 CLI 工具):
    pip install -U huggingface_hub
    huggingface-cli download google/gemini-3-pro-120b-open --local-dir ./gemini-3-pro

第二步:极速本地部署指南

由于 120B 参数的原生模型对显存要求极高(至少需要 4 块 H100 80GB),普通玩家通常需要进行量化,谷歌本次非常贴心地官方推荐了 GGUF 量化格式。

场景 A:拥有高性能计算卡的开发者 (PyTorch 原生) 如果你想跑全精度或 BF16:

from transformers import Gemini3ForConditionalGeneration, AutoTokenizer
import torch
model_name = "./gemini-3-pro"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = Gemini3ForConditionalGeneration.from_pretrained(
    model_name,
    torch_dtype=torch.bfloat16,
    device_map="auto"
)
# 开启多模态输入
inputs = tokenizer.encode_plus(
    "描述这张图片里的生物特征:<image:./cat.jpg>", 
    return_tensors="pt"
).to("cuda")
outputs = model.generate(**inputs, max_new_tokens=512)
print(tokenizer.decode(outputs[0], skip_special_tokens=True))

场景 B:消费级显卡/苹果 M 系列芯片用户 (Ollama) 得益于社区极快的响应速度,Ollama 已经支持了一键部署。

  1. 更新 Ollama 并拉取模型:
    # 拉取 4-bit 量化版(约 60GB),适合 Mac Studio 或 RTX 4090 (通过内存卸载)
    ollama pull gemini3:120b-q4_K_M
  2. 运行交互:
    ollama run gemini3:120b-q4_K_M

    小编实测: 在 RTX 6000 Ada 上运行 Q4 量化版,思考速度极快,逻辑能力完整保留。

第三步:微调你的专属 Gemini

谷歌不仅给了“鱼”,还给了“渔”,本次同步开源了 Gemini 3 Nano (2B 参数),这是一个专门用于端侧部署的模型,非常适合微调。

使用谷歌自研的 HuggingFace TRL 兼容库,你可以用极低成本微调:

# 安装依赖
pip install trl accelerate peft
# 使用 LoRA 微调 Nano 模型
python sft.py \
  --model_name_or_path google/gemini-3-nano-2b \
  --dataset_name "your_dataset" \
  --use_lora \
  --learning_rate 1e-4

行业冲击波:皮查伊的“阳谋”

为什么谷歌选择在 2026 年这个时候开源最核心的模型?

业内分析人士在 I/O 大会后指出,这并非谷歌的“慈善”,而是一场生态争夺战,随着 Claude 和 GPT-5 在企业级应用的固化,谷歌需要通过开源来抢占开发者心智,并推动 TPU 云服务的销售,毕竟,开源模型最难的那部分(推理服务)最终大多还是会跑在 Google Cloud 的 TPU v6 上。

不管巨头们的算盘怎么拨,对于开发者来说,这无疑是 2026 年最好的礼物,一个功能不受限、长上下文、原生多模态的开源巨兽已经出笼。

大家赶紧去下载体验吧!如果在部署中遇到问题,欢迎在评论区留言,Gemini中文网会在第一时间为大家带来解决方案。

(本文由 Google Gemini 2.5 Pro 辅助资料整理与排版,由Gemini中文网编辑人工审核发布)

代充值chatgpt plus

本文链接:https://google-gemini.cc/gemini_812.html

Gemini 3开源

相关文章