Google宣布将于6月推出其开放模型的27B参数版本:Gemma 2

Google宣布将于6月推出其开放模型的27B参数版本:Gemma2PaliGemma是一种预训练的Gemma变体,Google将其描述为"Gemma系列中的第一个视觉语言模型",适用于图像标题、图像标签和视觉问答用例。到目前为止,今年早些时候推出的标准Gemma模型只有20亿参数和70亿参数两个版本,因此这个新的270亿参数模型是一个相当大的进步。Google实验室副总裁乔希-伍德沃德(JoshWoodward)在周二的发布会上指出,Gemma模型在各种服务平台上的下载次数已超过"数百万次"。他强调说,Google对270亿个模型进行了优化,使其能够在英伟达(NVIDIA)的下一代GPU、单个Google云TPU主机和受管理的顶点人工智能服务上运行。Google还没有分享有关Gemma2的大量数据,所以我们只能等开发者拿到它之后再看它的表现。"我们已经看到了一些很好的质量。它的性能已经超过了比它大两倍的模型,"伍德沃德说。...PC版:https://www.cnbeta.com.tw/articles/soft/1430902.htm手机版:https://m.cnbeta.com.tw/view/1430902.htm

相关推荐

封面图片

Google 推出开源大模型更新 Gemma 2

Google推出开源大模型更新Gemma2Google今天发布了其下一代开源大模型Gemma2,有9B和27B两种参数大小。与第一代相比,其性能更高、推理效率更高,并且内置了显著的安全改进。Google称,27B的模型性能可以与比其大两倍的模型相媲美。这些大模型可在单个NVIDIAH100GPU或TPU主机实现全精度推理,从而显著降低部署成本。Gemma2也可以在CPU上使用量化版本进行本地推理,或者在配备NVIDIARTX或GeForceRTX的个人电脑上使用。——

封面图片

Google 宣布辅助编程用的开放大模型 CodeGemma

Google宣布辅助编程用的开放大模型CodeGemmaGoogle宣布了辅助编程用的开放大模型,模型权重可以在上下载。CodeGemma是基于Google今年2月发布的轻量级开放大模型Gemma,针对Gemma的两个不同参数规模的版本Gemma2B和Gemma7B发布了CodeGemma2B和CodeGemma7B(有预训练和指令微调两种)。来源,频道:@kejiqu群组:@kejiquchat

封面图片

Google 推出 Gemma 开源模型

这是一款轻量级、先进的开源模型,供开发者和研究人员用于AI构建。Gemma模型家族包括Gemma2B和Gemma7B两种尺寸,能够在不同的设备类型上运行,包括笔记本电脑、桌面电脑、IoT设备、移动设备和云端。性能和设计Gemma模型在技术和基础设施组件上与Gemini共享,这使得Gemma2B和7B在其大小范围内相比其他开放模型具有最佳性能。Gemma模型不仅可以直接在开发者的笔记本电脑或桌面电脑上运行,而且在关键基准测试中的表现超过了更大的模型,同时遵循严格的安全和负责任输出标准。主要特点:1、轻量级、高性能模型:Gemma模型家族包括Gemma2B和Gemma7B.两种尺寸,提供预训练和指令调优的变体,针对其大小范围内相比其他开放模型具有最佳性能。2、跨框架工具链支持:支持JAX、PyTorch和TensorFlow通过原生Keras3.0.进行推理和监督式微调(SFT),适应多种开发需求和环境。3、易于入门和集成:提供准备就绪的Colab和Kaggle笔记本,以及与HuggingFace、MaxText、NVIDIANeMo.和TensorRT-LLM等流行工具的集成,方便开发者快速上手。4.高效的运算能力:针对多个AI硬件平台上进行优化,确保在NVIDIAGPU和GoogleCloudTPU上的行业领先性能。通过与NVIDIA的合作,无论是在数据中心、云端还是本地RTXAIPC上,都确保了行业领先的性能和与尖端技术的集成。Gemma模型能够在不同的设备类型上运行,这种广泛的兼容性使得模型能够适应各种应用场景和需求。HuggingFace测试链接:https://huggingface.co/models?other=gemmavia匿名标签:#Google#Gemma频道:@GodlyNews1投稿:@GodlyNewsBot

封面图片

Google DeepMind推出Gemma模型

GoogleDeepMind推出Gemma模型这是一款轻量级、先进的开源模型,供开发者和研究人员用于AI构建。Gemma模型家族包括Gemma2B和Gemma7B两种尺寸,能够在不同的设备类型上运行,包括笔记本电脑、桌面电脑、IoT设备、移动设备和云端。性能和设计Gemma模型在技术和基础设施组件上与Gemini共享,这使得Gemma2B和7B在其大小范围内相比其他开放模型具有最佳性能。Gemma模型不仅可以直接在开发者的笔记本电脑或桌面电脑上运行,而且在关键基准测试中的表现超过了更大的模型,同时遵循严格的安全和负责任输出标准。主要特点:1.轻量级、高性能模型:Gemma模型家族包括Gemma2B和Gemma7B两种尺寸,提供预训练和指令调优的变体,针对其大小范围内相比其他开放模型具有最佳性能。2.跨框架工具链支持:支持JAX、PyTorch和TensorFlow通过原生Keras3.0进行推理和监督式微调(SFT),适应多种开发需求和环境。3.易于入门和集成:提供准备就绪的Colab和Kaggle笔记本,以及与HuggingFace、MaxText、NVIDIANeMo和TensorRT-LLM等流行工具的集成,方便开发者快速上手。4.高效的运算能力:针对多个AI硬件平台上进行优化,确保在NVIDIAGPU和GoogleCloudTPU上的行业领先性能。通过与NVIDIA的合作,无论是在数据中心、云端还是本地RTXAIPC上,都确保了行业领先的性能和与尖端技术的集成。Gemma模型能够在不同的设备类型上运行,包括笔记本电脑、桌面电脑、IoT设备、移动设备和云端。这种广泛的兼容性使得模型能够适应各种应用场景和需求。

封面图片

Google加入开源战局 低配版Gemma相当于OpenAI把GPT-3开源了

Google加入开源战局低配版Gemma相当于OpenAI把GPT-3开源了怎么理解这个动作的重要性呢?你可以粗暴的理解为:这有点像现在正在训练更强大的GPT-5的OpenAI,把GPT3的低参数版给开源了。(前几天SamAltman被问过这个问题,你们是否会在未来把GPT3开源,他没有直接回答。现在看来Google针对性很强啊。)(X上一张有意思的图)根据Google官方对Gemma的介绍,它的基本信息如下:Gemma是Google开源的一个大型语言模型,而非像Gemini那样是多模态的,它基于与Gemini相同的技术构建,但完全公开并允许商用授权。Gemma模型有两个主要版本,分别是Gemma7B(70亿参数)和Gemma2B(20亿参数)。这些模型在大规模的数据集上进行了训练,数据集包含了以英语为主的网络文档、数学数据以及代码数据,总量达到了6万亿tokens。Gemma模型的特点包括:架构细节:Gemma模型具有不同的参数规模,Gemma-2B有18层,d_model为2048,而Gemma-7B有28层,d_model为3072。这些模型还具有不同的前馈隐藏维度、头数和KV头数,以及词汇量。新技术:Gemma采用了一些新技术,如Multi-QueryAttention、RoPEEmbeddings、GeGLU激活函数以及NormalizerLocation,这些技术有助于提高模型的性能。评测结果:Google官方宣称Gemma模型在70亿参数规模的语言模型中表现最佳,甚至超过了一些参数量更大的模型。开源情况:Gemma模型遵循一个自定义的开源协议,允许商业使用。发布完,JeffDean就对这个系列模型划了重点:Gemma-7B模型在涵盖通用语言理解、推理、数学和编程的8项基准测试中,性能超过了广泛使用的Llama-27B和13B模型。它在数学/科学和编程相关任务上,通常也超过了Mistral7B模型的性能。Gemma-2BIT和Gemma-7BIT这两个经过指令调整的模型版本,在基于人类偏好的安全评估中,都优于Mistral-7Bv0.2指令模型。特别是Gemma-7BIT模型在遵循指令方面也表现更佳。(有意思的是,在Google晒出的成绩对比中,阿里的千问背后的模型Qwen系列表现也很亮眼)我们也发布了一个负责任的生成性人工智能工具包(ResponsibleGenerativeAIToolkit),它为负责任地使用像Gemma模型这样的开放模型提供了资源,包括:关于设定安全政策、安全调整、安全分类器和模型评估的指导。学习可解释性工具(LearningInterpretabilityTool,简称LIT),用于调查Gemma的行为并解决潜在问题。一种构建具有最小样本量的强大安全分类器的方法论。我们发布了两个版本的模型权重:Gemma2B和Gemma7B。每个版本都提供了预训练和指令调整的变体。我们为所有主要框架提供了推理和监督式微调(SFT)的工具链:通过原生Keras3.0支持的JAX、PyTorch和TensorFlow。提供了即用型的Colab和Kaggle笔记本,以及与流行的工具如HuggingFace、MaxText、NVIDIANeMo和TensorRT-LLM的集成,使得开始使用Gemma变得简单。预训练和指令调整的Gemma模型可以在您的笔记本电脑、工作站或GoogleCloud上运行,并且可以轻松部署在VertexAI和GoogleKubernetesEngine(GKE)上。在多个AI硬件平台上的优化确保了行业领先的性能,包括NVIDIAGPU和GoogleCloudTPUs。使用条款允许所有规模的组织负责任地进行商业使用和分发。可以看到JeffDean和Google这次都十分强调开源模型的安全性和具体的实打实的配套设施和举措。这似乎也直至被诟病CloseAI且被外界质疑安全性保障的OpenAI。现在,憋坏了的Google正式四面开战了。未来它将用Gemma对抗Llama,用Gemini对抗GPT。无论是开源还是闭源,竞争越来越焦灼了。相关文章:Google发布了一对开源人工智能模型Gemma2B和7B适用于较小的任务...PC版:https://www.cnbeta.com.tw/articles/soft/1419839.htm手机版:https://m.cnbeta.com.tw/view/1419839.htm

封面图片

谷歌发布开源 AI 大模型 Gemma 称其性能在同等规模中最为先进

谷歌发布开源AI大模型Gemma称其性能在同等规模中最为先进当地时间周三(2月21日),科技巨头谷歌发布了新一代开源模型“Gemma”,公司称其是轻量级中“最先进的”开放模型系列,超越了原本最强的Mistral7B。目前,Gemma系列有两种权重规模的模型,分别为“Gemma2B”和“Gemma7B”,即20亿参数和70亿参数,以满足开发人员的不同需求。谷歌在新闻稿中写道,Gemma2B和7B与其他开放模型相比,展现出在同等参数规模中最先进的性能,甚至超过了一些更大的模型,这得益于与公司最强的AI模型Gemini共享技术和基础架构。

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人