谷歌集大成之作要来了据称将发布AI大模型Gemini 对标GPT-4

谷歌集大成之作要来了据称将发布AI大模型Gemini对标GPT-4在ChatGPT掀起的人工智能浪潮中，谷歌今年加大了对生成式人工智能（AIGC）的投资，试图迎头赶上。该公司花费了大量的计算资源和人力来开发这款产品，因此对谷歌来说，Gemini的发布事关重大。而允许外部开发者使用Gemini意味着谷歌正在考虑将其纳入其消费者服务。据知情人士透露，谷歌并将发布不同大小的Gemini版本，这样开发者就可以购买一个不那么复杂的版本来处理简单的任务，或者一个足够小的版本来在个人设备上运行。Gemini的功能Gemini是一个大语言模型的集合，它支持多种功能，包括：聊天机器人、生成原始文本、根据用户的要求总结文本等。Gemini还有望帮助软件工程师编写代码，并根据用户的要求生成原始图像。与现有型号相比，Gemini将大大提高帮助软件开发人员生成代码的能力。谷歌希望用它来追赶微软的GitHubCopilot代码助手，该助手由OpenAI的模型驱动，现在已经成为一个大热产品。谷歌此前还讨论过使用Gemini来增强图表分析等功能，比如让该模型解释已完成图表的含义；以及使用文本或语音命令来浏览网页浏览器或其他软件。此外，谷歌计划通过其谷歌云的VertexAI服务向企业提供Gemini模型，变相促进了谷歌的云服务业务。除了推动云服务器租赁业务外，谷歌还寄望于该软件为其所有业务提供动力，从其Bard聊天机器人到Workspace软件的新功能。...PC版：https://www.cnbeta.com.tw/articles/soft/1384103.htm手机版：https://m.cnbeta.com.tw/view/1384103.htm

在Telegram中查看

相关推荐

传谷歌即将发布GPT-4竞品Gemini

传谷歌即将发布GPT-4竞品Gemini据知情人士透露，国外媒体TheInformation报道称，Google已向少数公司提供了Gemini早期版本进行测试，Gemini模型的正式发布即将到来。Gemini是GoogleDeepMind团队紧锣密鼓开发的下一代AI模型，据悉是Google第一个能够处理文字、图片、视频等不同数据形式的多模态模型，同时可望帮助软件工程师根据提示需求生成代码，加速软件开发。投稿：@ZaiHuaBot频道：@TestFlightCN

谷歌为云客户提供Gemini Pro模型大部分功能可免费使用

谷歌为云客户提供GeminiPro模型大部分功能可免费使用谷歌云客户可以使用Gemini创建人工智能聊天机器人、易于查询的数据库和营销演示等应用程序。该公司还强调，GeminiPro在推出时将免费提供给云客户，但会施加一些限制措施。该公司表示，最终计划是确保其人工智能云产品的“价格具有竞争力”。目前，GeminiPro基于文本的功能比其6月份发布的上一代人工智能模型PaLM2的输入成本低4倍，输出成本低2倍。谷歌云首席执行官ThomasKurian声称，该人工智能模型旨在“以人类同时看到、听到、阅读、倾听和谈论不同类型信息的方式，概括、理解和操作不同类型的信息，包括文本、代码、音频、图像和视频。”虽然谷歌是生成式人工智能的先驱，但其产品的受欢迎程度却远远落后于ChatGPT。上周，谷歌试图通过发布Gemini来反驳这种说法。Gemini模型根据体量大小可分为GeminiUltra、GeminiPro、以及GeminiNano三个版本。谷歌表示，在根据行业标准进行的一系列测试中，功能最强大的GeminiUltra版本表现超过了OpenAI的GPT-4技术。在对一群特定客户进行测试后，该版本预计将于明年初向软件开发人员广泛提供。而周三升级后的GoogleAIStudio是一款免费的基于网络的开发者工具，谷歌称其为“最快的应用程序构建方式”，该工具允许客户使用GeminiAPI开发应用程序。与此同时，VertexAI为开发人员和云客户端提供了更多的定制服务。企业将能够使用自己的数据定制Gemini，并构建基于Gemini的搜索工具和聊天机器人等应用程序。Kurian表示，GeminiPro的定价正变得“更具吸引力”，开发人员将可以通过GoogleAIStudio免费使用GeminiPro和GeminiProVision，这适用于大多数应用程序开发需求，而VertexAI在明年年初之前都是免费的。另外，谷歌还更新了文本创建图片的升级模型Imagen2，增强了生成照片的真实感，文本渲染和标志生成能力。该公司还宣布与MistralAI建立全球合作伙伴关系，MistralAI是一家总部位于巴黎的人工智能初创公司，专注于开源软件。两家公司在一篇博客文章中表示，MistralAI将在谷歌云上分发一些人工智能产品，包括优化的专有语言模型。...PC版：https://www.cnbeta.com.tw/articles/soft/1404271.htm手机版：https://m.cnbeta.com.tw/view/1404271.htm

谷歌Chrome 126将集成Gemini Nano模型，实现本地文本生成功能

谷歌Chrome126将集成GeminiNano模型，实现本地文本生成功能在2024年I/O开发者大会上，谷歌宣布其Chrome126浏览器将引入GeminiNano模型，该模型能够在本地执行文本生成等功能，如生成产品评论、社交媒体帖子和其他简介，并针对Chrome浏览器进行了优化，显著提高了加载速度。此外，谷歌还计划在ChromeDevTools中提供Gemini功能，以便开发人员调试和优化应用程序，Gemini将能够解释错误信息并提供编码问题的解决建议。与此相比，微软的Edge浏览器中的人工智能助手Copilot并不在本地运行。关注频道@ZaiHuaPd频道投稿@ZaiHuabot

谷歌升级Gemini 1.5 Pro AI可以听音频了

谷歌升级Gemini1.5ProAI可以听音频了Gemini1.5Pro被视为Gemini家族中的“中量级”（middle-weight）模型，其性能已经超越了最大规模、最强大的GeminiUltra。谷歌表示，Gemini1.5Pro能够理解复杂指令，而且使用时无需对模型进行特别调整。需要指出的是，不通过VertexAI的用户无法体验到Gemini1.5Pro的全部功能。目前，大众主要通过Gemini聊天机器人与Gemini大语言模型互动。尽管GeminiUltra为GeminiAdvanced聊天机器人提供了强大支持，能理解较长的指令，但在反应速度上不及Gemini1.5Pro。除了Gemini1.5Pro的更新，谷歌还对其它大型人工智能模型进行了升级。特别是作为文本转图像生成模型的Imagen2，它增强了Gemini的图像生成能力。通过引入图像外延（Outpainting）和内填（Inpainting）功能，用户现在能更灵活地对图像的元素进行添加或删除。为确保Imagen模型生成的图片版权和来源可追溯，谷歌为所有生成图片加入了SynthID数字水印技术。这种创新技术通过几乎不可见的水印明确标识图片来源，可以通过专用工具进行检测。Imagen模型的许多新特性，如图像外延和内填技术，已被其他文本转图像模型采用，例如StabilityAI的StableCascade和Getty的GenerativeAIbyiStock。此外，这些技术也被广泛应用于消费电子产品中，如三星Galaxy手机。除图像生成的创新外，谷歌还公开展示了一种结合人工智能生成回答和谷歌搜索结果的方法，旨在为用户提供更实时、更准确的信息。然而，大语言模型生成的回答并非总是精准无误，有时可能会误导用户。因此，谷歌对Gemini模型设置了一些限制，比如禁止回答与2024年美国大选相关的问题。此前，Gemini模型因在生成历史人物描述时出现不准确而受到批评。...PC版：https://www.cnbeta.com.tw/articles/soft/1426835.htm手机版：https://m.cnbeta.com.tw/view/1426835.htm

外媒：谷歌发布Gemini更多是为营销仍落后于GPT-4

外媒：谷歌发布Gemini更多是为营销仍落后于GPT-4一年前，谷歌被OpenAI的聊天机器人ChatGPT打了个措手不及，此后就一直渴望描绘出自己在人工智能领域快速进步的画面。本周三谷歌突然提前发布了新的人工智能模型Gemini，可以发现魔术中的技巧，并在会计认证考试中取得好成绩。谷歌发布的演示视频也在社交媒体上引起了轰动，但从技术角度来看，谷歌仍然在追赶OpenAI。从谷歌Gemini与OpenAI顶级模型GPT-4的性能对比来看，谷歌最强大的GeminiUltra在高中物理、专业法律测试以及道德场景等大多数基准测试中都优于GPT-4。要知道，当前的人工智能竞赛几乎完全是由这些能力定义的。但在大多数基准测试中，GeminiUltra只比GPT-4高出几个百分点。换句话说，谷歌所谓的顶级人工智能模型较OpenAI至少一年前完成的工作效果提升有限。如果GeminiUltra真如谷歌所说那样在明年1月初发布，那么可能不会在顶级人工智能模型的头把交椅上呆太久时间。在谷歌努力追赶OpenAI的过程中，后者有将近一年的时间来开发新一代人工智能模型GPT-5。谷歌发布在社交媒体X上的演示视频乍一看令人印象深刻。谷歌的人工智能模型能够追踪塑料杯下的纸球，或者在勾勒出图片轮廓之前就推断出会是一只螃蟹，这些都显示出谷歌DeepMind人工智能实验室多年来训练的强大推理能力。这是其他人工智能模型所缺少的功能。但视频中展示的许多其他功能并不是谷歌独有的，ChatGPTPlus3也可以做得到，沃顿商学院教授伊森·莫里克（EthanMollick）就用实验证实了这一点。此外，谷歌也承认演示视频被编辑过。该公司在视频描述中说：“为了达到演示效果，我们缩短了延迟时间，Gemini的输出也压缩了。”这意味着模型做出响应所花费的时间实际上要比视频中展示的长。事实上演示也不是实时的，也没有通过语音交互完成。谷歌的一位发言人在谈到这段视频时表示，这段视频是“使用视频中的静止图像帧，并通过文本提示”制作出来的。有网站展示了其他人如何通过手势、绘画或其他物体的照片与Gemini互动。换句话说，演示视频中的声音只是在解释给Gemini做了哪些人工提示，Gemini输出的依旧是静态图片。这似乎与谷歌所谓一个人可以与Gemini进行流畅对话、模型可以实时观察周围世界并做出反应的暗示完全不同。演示视频也没有说明展示是GeminiUltra人工智能模型。这些细节表明，谷歌更多是在进行营销，希望人们记住自己拥有世界上最大的人工智能研究团队之一，并且比其他任何人都能获得更多数据。正如谷歌在周三所做的那样，公司希望在Chrome、Android和Pixel手机上推出适用于终端设备的Gemini模型，提醒人们公司的部署网络规模有多庞大。但在科技行业，无处不在并不总是看起来那么有优势。早期的手机霸主诺基亚(和黑莓）就经历过惨痛教训，苹果用功能更强大、更直观的iPhone抢走了它们的市场。在软件领域，商业上的成功往往来自于性能最好的系统。几乎可以肯定的是，谷歌这番操作是为了利用OpenAI最近的动荡局势。据报道，当OpenAI董事会暂时罢免首席执行官萨姆·奥特曼(SamAltman)，使公司的未来发展受到质疑时，谷歌迅速发起了一场营销活动，说服OpenAI企业客户转向谷歌。现在，随着Gemini的发布，谷歌似乎正在利用这种不确定性。但演示的效果有限。谷歌之前已经展示过新技术，但没有任何进展。到目前为止，谷歌的庞大架构和层叠复杂的产品经理设置使其无法像OpenAI那样灵活发布产品。随着全社会努力应对人工智能的变革性影响，谷歌的最新举措并不是一件坏事，但效果有待观察。可以肯定的是，谷歌仍然在后面努力追赶。...PC版：https://www.cnbeta.com.tw/articles/soft/1402909.htm手机版：https://m.cnbeta.com.tw/view/1402909.htm

OnePlus 和 Oppo 智能手机计划今年晚些时候集成谷歌 Gemini Ultra 模型

OnePlus和Oppo智能手机计划今年晚些时候集成谷歌GeminiUltra模型OnePlus和OPPO宣布计划将谷歌的人工智能模型Gemini1.0Ultra集成到他们的智能手机中，并表示计划今年晚些时候在智能手机上发布由GeminiUltra支持的人工智能功能。目前，谷歌Gemini模型共有三个版本：Nano、Pro和Ultra，例如Pixel8系列智能手机就搭载了GeminiNano。三星GalaxyS24系列搭载GeminiPro。Oppo和OnePlus也将加入其中，但与Pixel和三星不同的是，它们将搭载Gemini1.0Ultra，这将是最强大的版本。此外，搭载Gemini后，将计划发布基于GeminiUltra的人工智能功能，例如新闻摘要、录音机摘要和AI工具箱。还暗示了其他生成式人工智能功能，例如社交媒体平台的文本和图像生成工具。然而与可以在设备上运行的GeminiNano不同，Ultra运行在谷歌的服务器上，因此OPPO和OnePlus智能手机可能需要互联网连接才能使用人工智能功能。——

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人