Gemini 1.5 Pro 已上线 Poe

Poe在X表示,Gemini1.5Pro已在Poe推出,Google的这个强大的新多模态模型引入了业界领先的100万个tokens(约70万个单词)的上下文窗口,具有近乎完美的检索能力,可实现需要长上下文理解的复杂任务。Gemini1.5Pro支持文本、图像和视频输入,并具有文本输出功能。它目前在Poe中提供三个版本:Gemini1.5Pro、128k、1M。此外,Poe还添加了原版GeminiPro的升级版。该机器人经过微调,具有更具对话性的个性,并在推理、数学、延迟、讲故事和总结等方面具有质量改进。via匿名标签:#Gemini#Poe#AI频道:@GodlyNews1投稿:@GodlyNewsBot

相关推荐

封面图片

Google继Gemini 1.0 Ultra之后,推出了更高能力的模型Gemini 1.5。Gemini 1.5 Pro引入了

Google继Gemini 1.0Ultra之后,推出了更高能力的模型Gemini1.5。Gemini1.5Pro引入了一个实验性功能,能够处理长达1百万token的上下文窗口,上下文内容包括:代码、文本、图像和影片。同时,Gemini1.5采用了新的混合专家(Mixture-of-Experts,MoE)架构。从今天起,少数开发人员和企业客户可以通过AIStudio和VertexAI私有预览版中试用100万Token的上下文窗口的Gemini1.5Pro。https://blog.google/technology/ai/google-gemini-next-generation-model-february-2024/投稿:@TNSubmbot频道:@TestFlightCN

封面图片

谷歌发布了Gemini 1.5模型,最主要的升级是支持了高达 100 万的上下文长度,秒杀了所有模型。#ai##llm#

谷歌发布了Gemini1.5模型,最主要的升级是支持了高达100万的上下文长度,秒杀了所有模型。Gemini1.5基于Transformer和MoE架构的研究和工程创新,提高了训练和服务的效率。Gemini1.5Pro是一个中等规模的多模态模型,适用于多种任务,并引入了在长上下文理解方面的实验性特性。它标准的上下文窗口为128,000个Token,但现在已经可以通过AIStudio和VertexAI向开发者和企业客户提供高达100万个Token的私人预览。1.5Pro可以一次处理大量信息——包括1小时的视频、11小时的音频、包含超过30,000行代码的代码库或超过700,000个单词。Gemini1.5Pro在文本、代码、图像、音频和视频评估的综合面板上的性能超过了Gemini1.0Pro,并且与1.0Ultra在同样的基准测试上表现相当。此外,Gemini1.5Pro在进行长上下文窗口的测试中表现出色,在NIAH评估中,它在长达100万个Token的数据块中99%的时间内找到了嵌入的文本。了解更多:#context-window

封面图片

Google Gemini模型已上线Poe

GoogleGemini模型已上线PoeGoogleGemini模型现已上线Poe,支持上传图片,官方介绍:这是谷歌Gemini家族的多模态模型的Beta版本,该模型在模型性能和速度之间实现了平衡。该模型展现了优秀的通用能力,尤其擅长跨模态推理,并支持最大32k个tokens的上下文窗口。via匿名标签:#Google#Gemini#Poe频道:@GodlyNews1投稿:@GodlyNewsBot

封面图片

Google Gemini 1.5 Pro 现已拥有“听觉”并推出公共预览版

Google对Gemini1.5Pro进行更新,赋予了模型“听觉”能力。现在,该模型可以聆听上传的音频文件,并从中提取信息,例如财报电话会议或视频中的音频,而无需参考文字记录。在GoogleNext大会上,Google还宣布将首次通过其构建AI应用的平台VertexAI向公众开放Gemini1.5Pro。Gemini1.5Pro最初于2月份发布。这个新版本的GeminiPro被认为是Gemini家族中的中量级模型,但在性能方面已经超越了最大、最强大的模型GeminiUltra。Google声称,Gemini1.5Pro可以理解复杂的指令,并且无需微调模型。目前,Gemini1.5Pro仅对拥有VertexAI访问权限的用户开放。大多数人通过Gemini聊天机器人接触到Gemini语言模型。GeminiUltra为GeminiAdvanced聊天机器人提供支持,虽然它功能强大,也能理解长指令,但速度不如Gemini1.5Pro。除了Gemini1.5Pro,Google的其他大型AI模型也获得了更新。Imagen2是支持Gemini图像生成功能的文本到图像生成模型,它将添加修复和扩展功能,允许用户添加或删除图像中的元素。Google还将其SynthID数字水印功能应用于所有通过Imagen模型创建的图片。SynthID在图像上添加了一个对观众不可见的水印,通过检测工具查看时可以标记其来源。Imagen的许多新功能,尤其是修复和扩展功能,已经是其他文本到图像模型的一部分,例如StabilityAI的StableCascade和Getty的GenerativeAIbyiStock,以及在较新的三星Galaxy手机上更广泛的消费者可用性。Google表示,它还公开预览了一种将AI响应与Google搜索结合起来的方式,以便AI能够提供最新的信息。via匿名标签:#Google#Gemini#AI频道:@GodlyNews1投稿:@GodlyNewsBot

封面图片

Google Gemini 1.5 Pro有一个自我学习的功能:当Gemini 1.5 Pro被给予一个关于Kalamang语言

GoogleGemini1.5Pro有一个自我学习的功能:当Gemini1.5Pro被给予一个关于Kalamang语言(一种全球不到200名说话者的小众语言)的语法手册时,它能够从提供的信息中学习新技能,并且能够执行从英语到Kalamang的翻译任务,其翻译水平与从相同内容学习的人类相似。这一成就凸显了Gemini1.5Pro处理罕见或小众语言的能力,同时也证明了其在理解和应用长篇复杂文本信息方面的强大性能。这种能力对于语言学习、自然语言处理、以及跨文化交流的应用具有重要意义。

封面图片

Gemini 数据分析能力并不像宣称的那么好

Gemini数据分析能力并不像宣称的那么好谷歌AI模型Gemini1.5Pro和1.5Flash据称能够凭借其“长上下文”完成以前不可能完成的任务,例如总结数百页的文档或搜索电影镜头中的场景。但新的研究表明,这些模型实际上在这些方面并不是很擅长。两项独立研究调查了Gemini模型和其他模型如何很好地理解大量数据。两项研究都发现Gemini1.5Pro和1.5Flash很难正确回答有关大型数据集的问题;在一系列基于文档测试中,这些模型给出正确答案的概率只有40%到50%。马萨诸塞大学阿默斯特分校博士后、其中一项研究的合著者MarzenaKarpinska说:“虽然像Gemini1.5Pro这样的模型在技术上可以处理长篇上下文,但我们已经看到许多案例表明,这些模型实际上并不‘理解’内容。”——

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人