先做个广告:需要购买Gemini帐号或代充值Gemini会员,请加微信:gptchongzhi
更新了什么?
推荐使用Gemini中文版,国内可直接访问:https://ai.gpt86.top
Gemini 2.0 Flash 全面领先上代王者 1.5 Pro 2
性能提升: 在保持与1.5 Flash一样快似闪电,但性能上确持平甚至优于1.5 Pro。
真多模态!!!: 你可以实时和 Gemni 交流了~大模型听到你的声音,看到你的世界,随时可以打断!!真的很强,就是不讲中文
你让他讲中文,他和你讲日语哇靠。
一时间不知道该怎么生气。
内置工具: Google Search、代码执行、Function Call ,这些都是老生常谈的能力了,但是 API 首次可以直接使用 Google Search,之前是要靠 Google 的模型验证功能擦边获取联网数据。 '
还有什么?
利用 Gemini 2.0 推动 AGI 的发展
Gemini 2.0 Flash 的原生用户界面操作能力,以及多模态推理、长上下文理解、复杂指令遵循和规划、组合函数调用、原生工具使用和改进的延迟等方面的改进。
目前研究项目有:
- Project Astra: 通用AI助手的未来形态。(他喵的 年初就公布了啊,赶紧端上来)
进展 在Google I/O大会上首次亮相,目前正在Android手机上进行可信测试。
• 基于Gemini 2.0的改进: • 更好的对话能力: 支持多语言和混合语言,更好地理解口音和不常用词汇。 • 新的工具使用: 集成Google Search、Lens和Maps,提升日常实用性。 • 增强的记忆能力: 最多10分钟的会话内记忆,并能记住过去的对话,提供更好的个性化体验。 • 改进的延迟: 新的流式处理能力和原生音频理解,实现接近人类对话的延迟。 • 快了 再等等 谷歌计划将这些功能引入Google产品,如Gemini应用和其他形态(如眼镜),并已开始扩大可信测试人员计划,包括在原型眼镜上进行测试的小组。
Project Mariner: 人机交互的未来,从浏览器开始。(操控我谷歌的浏览器,还需要你们教吗?)
进展 基于Gemini 2.0的早期研究原型,探索人机交互的未来,从浏览器开始,效果不是很好,有待提升。
• 功能: • 理解和推理浏览器屏幕上的信息,包括像素和网页元素(文本、代码、图像、表单)。 • 通过实验性Chrome扩展程序代表用户完成任务。 • 性能: 在WebVoyager基准测试(评估代理在真实世界网络任务中的端到端性能)中,作为单一代理设置实现了83.5%的SOTA结果。 • 现状与挑战: • 技术上已可实现浏览器内的导航。 • 当前准确性不高,任务完成速度较慢,但预计将迅速改进。 • 安全与责任: • 进行新型风险和缓解措施的积极研究,同时保持人工参与。 • 在执行敏感操作(如购买)之前,需要用户最终确认。
Jules: 辅助开发者的AI代码代理。 (全自动写代码,还能缺了我?)
准备直接集成到GitHub工作流程中。
• 功能: 在开发者指导和监督下,解决问题、制定计划并执行。 • 长期目标: 构建在所有领域(包括编码)都有帮助的AI代理的一部分。 • 开发阶段: 仍处于早期开发阶段,通过可信测试人员收集反馈,以便未来更广泛地应用于产品中。
最后,跑个分