Google发布了Gemini 1.5 Pro模型的技术报告，报告介绍了Gemini 1.5 Pro的模型架构、训练数据与基础设

Google发布了Gemini 1.5 Pro模型的技术报告，报告介绍了Gemini 1.5 Pro的模型架构、训练数据与基础设施、长文本评测和通用能力评测。其中一个例子是Gemini 1.5 Pro只需要一个生僻语种的语法手册就可以学会这个语言。论文简介： Gemini 1.5 Pro：这是一个高效能的多模态混合专家模型（mu ...

在Telegram中查看

相关推荐

Google发布Gemini 1.5 Flash人工智能模型比Gemini Pro更轻便与易于使用

Google发布Gemini 1.5 Flash人工智能模型比Gemini Pro更轻便与易于使用 Google DeepMind 首席执行官德米斯-哈萨比斯（Demis Hassabis）在一篇博客文章中写道："[Gemini] 1.5 Flash 擅长摘要、聊天应用、图像和视频字幕、从长文档和表格中提取数据等。"Google之所以创建Gemini 1.5 Flash，是因为开发人员需要一个比Google今年2月发布的专业版更轻便、更便宜的型号。Gemini 1.5 Pro 比该公司去年底发布的 Gemini 原型更高效、更强大。Gemini 1.5 Flash 介于 Gemini 1.5 Pro 和 Gemini 1.5 Nano 之间，是Google在本地设备上运行的最小型号。尽管重量比 Gemini Pro 轻，但功能却同样强大。Google表示，这是通过一个名为"蒸馏"的过程实现的，即把 Gemini 1.5 Pro 中最基本的知识和技能转移到更小的型号上。这意味着，Gemini 1.5 Flash 将获得与 Pro 相同的多模态功能，以及长语境窗口（人工智能模型可一次性摄取的数据量），即一百万个词元。根据Google的说法，这意味着 Gemini 1.5 Flash 将能够一次性分析 1500 页的文档或超过 30000 行的代码库。Gemini 1.5 Flash（或这些型号中的任何一款）并非真正面向消费者。相反，它是开发人员利用Google设计的技术构建自己的人工智能产品和服务的一种更快、更便宜的方式。除了推出 Gemini 1.5 Flash 之外，Google还对 Gemini 1.5 Pro 进行了升级。该公司表示，已经"增强"了该模型编写代码、推理和解析音频与图像的能力。但最大的更新还在后面Google宣布将在今年晚些时候把该模型现有的上下文窗口增加一倍，达到 200 万个词元。这将使它能够同时处理两小时的视频、22 小时的音频、6 万多行代码或 140 多万字。Gemini 1.5 Flash 和 Pro 现在都可以在Google的人工智能工作室和顶点人工智能中进行公开预览。该公司今天还发布了新版 Gemma 开放模型，名为 Gemma 2。不过，除非你是开发人员或喜欢捣鼓构建人工智能应用程序和服务的人，否则这些更新其实并不适合普通消费者。 ... PC版：手机版：

Poe 新增GPT-4o, Gemini 1.5 Flash,Gemini 1.5 Pro等模型

Poe 新增GPT-4o, Gemini 1.5 Flash,Gemini 1.5 Pro等模型标签: #OpenAI #Poe #Gemini 频道: @GodlyNews1 投稿: @GodlyNewsBot

Gemini 1.5 Pro 模型候补名单申请

Gemini 1.5 Pro 模型候补名单申请使用屏幕过小的设备访问可能会提示错误信息：Browser window too narrow 标签: #Google #Gemini 频道: @GodlyNews1 投稿: @GodlyNewsBot

Gemini 1.5 Pro 现已通过 Google AI Studio 推出

Gemini 1.5 Pro 现已通过 Google AI Studio 推出 Gemini 1.5 Pro 已向所有用户开放。Gemini 里也已支持添加图片、视频、文档，现在AI助手的这些功能基本上是标配了。如打不开，可切换美国IP尝试。使用链接：点击打开

谷歌升级Gemini 1.5 Pro AI可以听音频了

谷歌升级Gemini 1.5 Pro AI可以听音频了 Gemini 1.5 Pro被视为Gemini家族中的“中量级”（middle-weight）模型，其性能已经超越了最大规模、最强大的Gemini Ultra。谷歌表示，Gemini 1.5 Pro能够理解复杂指令，而且使用时无需对模型进行特别调整。需要指出的是，不通过Vertex AI的用户无法体验到Gemini 1.5 Pro的全部功能。目前，大众主要通过Gemini聊天机器人与Gemini大语言模型互动。尽管GeminiUltra为Gemini Advanced聊天机器人提供了强大支持，能理解较长的指令，但在反应速度上不及Gemini 1.5 Pro。除了Gemini 1.5 Pro的更新，谷歌还对其它大型人工智能模型进行了升级。特别是作为文本转图像生成模型的Imagen 2，它增强了Gemini的图像生成能力。通过引入图像外延（Outpainting）和内填（Inpainting）功能，用户现在能更灵活地对图像的元素进行添加或删除。为确保Imagen模型生成的图片版权和来源可追溯，谷歌为所有生成图片加入了SynthID数字水印技术。这种创新技术通过几乎不可见的水印明确标识图片来源，可以通过专用工具进行检测。Imagen模型的许多新特性，如图像外延和内填技术，已被其他文本转图像模型采用，例如Stability AI的Stable Cascade和Getty的Generative AI by iStock。此外，这些技术也被广泛应用于消费电子产品中，如三星Galaxy手机。除图像生成的创新外，谷歌还公开展示了一种结合人工智能生成回答和谷歌搜索结果的方法，旨在为用户提供更实时、更准确的信息。然而，大语言模型生成的回答并非总是精准无误，有时可能会误导用户。因此，谷歌对Gemini模型设置了一些限制，比如禁止回答与2024年美国大选相关的问题。此前，Gemini模型因在生成历史人物描述时出现不准确而受到批评。 ... PC版：手机版：

Google Gemini 1.5 Pro有一个自我学习的功能：当Gemini 1.5 Pro被给予一个关于Kalamang语言

Google Gemini 1.5 Pro有一个自我学习的功能：当Gemini 1.5 Pro被给予一个关于Kalamang语言（一种全球不到200名说话者的小众语言）的语法手册时，它能够从提供的信息中学习新技能，并且能够执行从英语到Kalamang的翻译任务，其翻译水平与从相同内容学习的人类相似。这一成就凸显了Gemini 1.5 Pro处理罕见或小众语言的能力，同时也证明了其在理解和应用长篇复杂文本信息方面的强大性能。这种能力对于语言学习、自然语言处理、以及跨文化交流的应用具有重要意义。

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人