先做个广告:需要购买Gemini帐号或代充值Gemini会员,请加微信:gptchongzhi
作为美国国内最具实力并且是与OpenAI微软相争不下的巅峰之作,谷歌再次向我们展示了他们高产模式下超越自我从容不迫地带给我们惊喜。
推荐使用Gemini中文版,国内可直接访问:https://ai.gpt86.top
在被OpenAI的Sora震惊了一夜,各个群里又长吁短叹了一整天, 然而正当大家还在忙着分析Sora的技术细节,行业的深远影响之时,又是一颗深夜炸弹:谷歌发布了令人惊叹的Gemini 1.5系列。
Alphabet 与 Google 公司首席执行官孙达尔・皮柴(Sundar Pichai)表示:
我们上周推出了功能强大的 Gemini 1.0 Ultra 模型,并从 Gemini Advanced 开始,让谷歌产品在实用性上迈上新台阶。
开发者和云计算客户今天开始可以使用 1.0 Ultra 开始构建,在 AI Studio 和 Vertex AI 中使用我们的 Gemini API。
这意味着什么?谷歌表示:“1.5 Pro 可以一次性处理大量信息,包括 1 小时的视频、11 小时的音频、超过 3 万行代码的代码库或超过 70 万字的文字。在我们的研究中,我们还成功测试了多达 1000 万个标记。”
Gemini 1.5 Pro 正在检查阿波罗 11 号登月任务中长达 402 页的 PDF 文稿。谷歌甚至给出了一张靴子即将踏下的简短图画,它就能回答这是尼尔・阿姆斯特朗(Neil Armstrong)登月的相关信息。
下面是 Gemini 1.5 Pro 处理巴斯特-基顿(Buster Keaton)44 分钟无声电影(696,000 个 token)的情况,它能够分析情节点和其他事件以提及时间码,甚至还能回答多种模式的提示(例如提供一个简短的草图并询问场景是什么):
在推出 Gemini 1.5 的同时,谷歌继续将安全性和人工智能模型的快速发展放在首位。根据皮查伊的说法,Gemini 1.5 Pro 可达到与 1.0 Ultra 模型相当的质量,同时使用更少的计算能力,因此效率更高。
Gemini 1.5 Pro 可以处理 128000 个 token 的标准情境窗口,但仅限特定开发人员和企业客户使用的版本可以处理多达 100 万个 token。
这款最新一代多模态大模型可支持高达10,000K token的超长上下文,并被誉为谷歌最强的MoE大模型。这意味着我们可以更轻松地与数十万字的超长文档、数百个文件的代码库甚至是整部电影进行交互。
而且,Gemini 1.5还能够处理音频和视频内容,在海量数据中准确找到隐藏信息片段。其性能不仅比肩Ultra版本,还远超过前代Gemini 1.0 Pro。
该团队通过Sparsely-Gated MoE、GShard-Transformer等技术创新,实现了卓越性能和高效训练部署。此外,他们还开发了一个通用测试来验证模型对于复杂信息处理和学习任务的表现。
通过将专家神经网络组合成MoE架构,Gemini 1.5实现了更精细化、高效率的运行方式。它不仅能迅速掌握复杂任务并输出高质量结果,还能够处理更长的代码和更复杂的文档。
Gemini 1.5的发布标志着大语言模型领域进入了全新的时代。谷歌在研究和工程创新方面又迈出了一大步,距离GPT-5只有一步之遥。
就在刚才DeepMind首席科学家Jeff Dean及联合创建人兼CEO Demis Hassabis激动宣布: Gemini第2季度即将来袭, 高端版(Pro)已经达到百万级别。
其所预设技术成果是很长连续片段见解
同时为这款骄傲推出58页报告, 新时代即将来临.
在海底捞针测试中,Gemini 1.5 Pro能够处理高达530,000 token的文本,实现100%的检索完整性。甚至在处理高达10,000,000 token的文本时,检索准确性仍然高达99.2%。
同时Gemini 1.5 Pro还能够对音频和视频进行深度理解和推理。它可以准确地找出一部电影中特定情节发生的时间点,并且可以从图像中识别出特定场景。
此外,谷歌还通过MoE(混合专家)架构创新提升了模型性能。Gemini 1.5具备更大的上下文窗口容量,从原始32,000 token提升到惊人的1,000,000 token。
这意味着该模型可以一次性处理大量信息,并且展示出对复杂信息的深入理解。
简而言之,Gemini 1.5完全碾压了GPT-4 Turbo,迅速破100万的极限上下文记录.
Gemini 1.5不仅比肩Ultra版本,在综合测试中超越了前代产品Gemini 1.0 Pro。其诞生标志着谷歌在研究和工程创新方面又迈进了一步,离发布GPT-5只有一步之遥。