谷歌发布最新多模态模型 Gemini

谷歌发布最新多模态模型 Gemini Gemini能够归纳并流畅地理解、操作处理包括文本、代码、音频、图像和视频在内的信息。 据说宣传视频有造假嫌疑,在图像识别方面,最好的个人感觉还是GPT4,好在 Gemini 可以在Bard中使用,目前Bard也还没有收费。Gemini目前是白嫖党最好的选择了。

相关推荐

封面图片

支付宝发布多模态医疗大模型

支付宝发布多模态医疗大模型 7 月 5 日,在 2024 世界人工智能大会,支付宝多模态医疗大模型正式亮相,成为国内首批多模态医疗大模型之一。基于蚂蚁百灵的多模态能力,该模型可实现直接理解并训练音频、视频、图、文等多模态数据。测试期间,对诊疗报告、医学药品、毛发状况等识别准确率达 90% 以上,中英文医疗考试、基准测试达到或超过 GPT4 水准。会上,支付宝还推出了与大模型配套的可信一体机与云解决方案,并与全国 20 家头部三甲医院、医疗管理机构,联合发起 AI 医疗共建计划,探索大模型创新应用。

封面图片

支付宝发布多模态医疗大模型

支付宝发布多模态医疗大模型 7 月 5 日,在 2024 世界人工智能大会 “可信大模型论坛” 上,支付宝发布多模态医疗大模型,同时推出包括医疗可信一体机、可信云等解决方案。据悉,支付宝医疗大模型经过半年多测试后推出,是国内首批多模态医疗大模型之一。蚂蚁集团大模型应用部总经理顾进杰介绍称,蚂蚁百灵大模型具备原生多模态能力,可直接理解并训练音频、视频、图、文等多模态数据。支付宝医疗大模型以此为基座模型,添加了百亿级中英文图文、千亿级医疗文本语料及千万级医疗知识图谱,中英文医疗考试、基准测试达到或超过 GPT4 水准。

封面图片

谷歌推出最新的大型语言模型 Gemini 1.0

谷歌推出最新的大型语言模型 Gemini 1.0 谷歌发布最新的大型语言模型 Gemini,谷歌 CEO 皮查伊在 6 月份的 I/O 开发者大会上首次透露了该模型,现在正式向公众推出。 谷歌针对不同场景发布了三种不同尺寸的版本。例如 Google 的人工智能聊天机器人 Bard 现在由可扩展的 Gemini Pro 提供支持。 Gemini Nano 是轻量版本,旨在 Android 设备上本地离线运行,Pixel 8 Pro 成为首款搭载此模型的设备。 Gemini Ultra,它是谷歌迄今为止创建的最强大的 LLM,适用于高度复杂的任务。似乎主要是为数据中心和企业应用设计的。

封面图片

谷歌 Bard 更新:Gemini Pro 正式面向全球用户推出

谷歌 Bard 更新:Gemini Pro 正式面向全球用户推出 去年 12 月,谷歌将 Gemini Pro 英文版引入 Bard,赋予 Bard 更高级的理解、推理、总结和编码能力。今天,Gemini Pro 版 Bard 正式面向 Bard 支持的所有语言在 230 多个国家推出。 此外,Bard 可以生成英文图像了,这项新功能由 Imagen 2 模型提供支持,需要英语指令。只需输入描述,Bard 就会生成定制的、范围广泛的视觉效果,帮助您将想法变为现实。

封面图片

Bard现已在全球范围内采用Gemini Pro模型

Bard现已在全球范围内采用Gemini Pro模型 12 月,Google推出了新的生成式人工智能模型,包括旗舰版 Gemini Ultra、"精简版"Gemini Pro和专为在 Pixel 8 等设备上运行而设计的 Gemini Nano。与此同时,该公司还更新了 Bard 与 Gemini Pro 的英语对话。Google没有量化这些改进,但表示聊天机器人在理解和总结内容、推理、头脑风暴、写作和计划方面会有更好的表现。Bard 在后台经历了几次迭代。最初在 2023 年 2 月亮相时,它采用的是 LaMDA(对话应用语言模型);今年晚些时候,它又更新了一个新模型,称为 PaLM 2;现在,由 Gemini Pro 支持的 Bard 将在 230 多个国家推出,这些名称和版本令人困惑。今年 9 月,Google推出了"双重检查"功能,利用Google搜索来评估其返回的结果是否与 Bard 生成的结果相似。当时,该功能只有英文版。现在,Google正在扩展对 40 多种语言的支持。此外,这家搜索巨头还通过 12 月份发布的 Imagen 2 模型引入了图像生成支持。目前,该功能仅支持英语。用户可以在聊天机器人界面上输入类似"创建一辆未来派汽车的图像"这样的查询。通过 Bard 图像生成的图像示例Google公司表示,Bard生成的图片将在像素中嵌入由DeepMind开发的SynthID数字水印。不过,你必须使用Google的工具来识别这些图像。今年 10 月,Google为Google Assistant注入了 Bard 的人工智能功能,这样用户就可以做一些事情,比如计划旅行或制定杂货清单。11 月,Google向青少年开放了英文版的 Bard,并对其进行了限制,防止 Bard 生成不安全的内容,如非法或有年龄限制的物质。 ... PC版: 手机版:

封面图片

谷歌发布了Gemini 1.5模型,最主要的升级是支持了高达 100 万的上下文长度,秒杀了所有模型。

谷歌发布了Gemini 1.5模型,最主要的升级是支持了高达 100 万的上下文长度,秒杀了所有模型。 Gemini 1.5基于Transformer和MoE架构的研究和工程创新,提高了训练和服务的效率。 Gemini 1.5 Pro是一个中等规模的多模态模型,适用于多种任务,并引入了在长上下文理解方面的实验性特性。 它标准的上下文窗口为128,000个Token,但现在已经可以通过AI Studio和Vertex AI向开发者和企业客户提供高达100万个Token的私人预览。 1.5 Pro 可以一次处理大量信息包括 1 小时的视频、11 小时的音频、包含超过 30,000 行代码的代码库或超过 700,000 个单词。 Gemini 1.5 Pro在文本、代码、图像、音频和视频评估的综合面板上的性能超过了Gemini 1.0 Pro,并且与1.0 Ultra在同样的基准测试上表现相当。 此外,Gemini 1.5 Pro在进行长上下文窗口的测试中表现出色,在NIAH评估中,它在长达100万个Token的数据块中99%的时间内找到了嵌入的文本。 了解更多:#context-window

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人