Mistral发布首个代码生成人工智能模型Codestral 但不可用于商业活动

Mistral发布首个代码生成人工智能模型Codestral 但不可用于商业活动 Mistral 在一篇博文中解释说,它接受过 80 多种编程语言的训练,包括 Python、Java、C++ 和 JavaScript。Codestral 可以完成编码功能、编写测试和"填充"部分代码,还能用英语回答有关代码库的问题。Mistral 将这种模式描述为"开放",但这还有待商榷,因为这家初创公司的许可证禁止将 Codestral 及其产出用于任何商业活动。虽然有"开发"的例外,但即使是"开发"也有注意事项:许可证明确禁止"员工在公司业务活动中的任何内部使用",究其原因可能是 Codestral 部分训练内容受版权保护。Mistral 在博文中没有证实或否认这一点,但这并不奇怪;有证据表明,这家初创公司以前的训练数据集包含版权数据。无论如何,Codestral 可能不值得这么麻烦。该模型有 220 亿个参数,需要一台强大的电脑才能运行。(参数基本上决定了人工智能模型处理问题的能力,比如分析和生成文本)。虽然根据一些基准测试(我们都知道,这些基准测试并不可靠),该模型击败了竞争对手 ,但这并不能说明它有多厉害。虽然 Codestral 对大多数开发人员来说并不实用,而且在性能提升方面也是渐进式的,但它肯定会引发关于依赖代码生成模型作为编程助手是否明智的争论。至少在某些编码任务中,开发人员肯定会使用生成式人工智能工具。在 2023 年 6 月的 Stack Overflow民意调查中,44% 的开发人员表示,他们现在在开发过程中使用人工智能工具,26% 的开发人员计划不久后使用。然而,这些工具有明显的缺陷。GitClear 对过去几年中提交到项目仓库的超过 1.5 亿行代码进行了分析,发现生成式人工智能开发工具正在导致更多错误代码被推送到代码库中。普渡大学的一项研究显示,OpenAI 的 ChatGPT对编程问题给出的答案有一半以上是错误的。但这并不能阻止 Mistral 等公司试图将其模式货币化(并获得心智份额)。今天上午,Mistral在其Le Chat对话式人工智能平台上推出了托管版Codestral以及付费API。Mistral表示,它还致力于将Codestral纳入LlamaIndex、LangChain、Continue.dev和Tabnine等应用框架和开发环境。 ... PC版: 手机版:

相关推荐

封面图片

美国参议院推动人工智能安全法案 旨在防止AI模型出现安全漏洞

美国参议院推动人工智能安全法案 旨在防止AI模型出现安全漏洞 该中心将领导研究法案中所说的"反人工智能",即学习如何操纵人工智能系统的技术。该中心还将制定预防反人工智能措施的指南。该法案还将要求国家标准与技术研究院(NIST)和网络安全与基础设施安全局建立一个人工智能漏洞数据库,包括"近乎得手的漏洞"。华纳和蒂利斯提出的法案重点关注对抗人工智能的技术,并将其分为数据中毒、规避攻击、基于隐私的攻击和滥用攻击。数据中毒指的是在人工智能模型刮取的数据中插入代码,破坏模型输出的方法。它是防止人工智能图像生成器在互联网上复制艺术作品的一种流行方法。规避攻击会改变人工智能模型所研究的数据,以至于模型变得混乱。人工智能安全是拜登政府人工智能行政命令的关键项目之一,该命令指示美国国家标准与技术研究院(NIST)制定"红队"指导方针,并要求人工智能开发人员提交安全报告。所谓"红队"(red teaming),是指开发人员故意让人工智能模型对不应该出现的提示做出反应。理想情况下,人工智能模型的开发者会对平台进行安全测试,并在向公众发布之前对其进行广泛的红队测试。一些公司如微软已经创建了一些工具,帮助人工智能项目更容易地添加安全防护措施。《人工智能安全法案》在提交给更大范围的参议院审议之前,必须经过一个委员会的审议。 ... PC版: 手机版:

封面图片

Mistral Large 大语言模型发布

Mistral Large 大语言模型发布 Mistral Large 是 Mistral 新的尖端文本生成模型。它达到了顶级的推理能力,可用于复杂的多语言推理任务,包括文本理解、转换和代码生成。Mistral Large 在常用基准测试中取得了优异的成绩,使其成为世界上排名第二的可通过 API 普遍使用的模型(仅次于 GPT-4)。该模型也可以通过 Azure 直接调用。 Mistral Large 具有以下特点 - 支持英语、法语、西班牙语、德语和意大利语。 - 32K 标记上下文窗口。 - 精确的指令遵循使开发人员能够设计他们的审核策略。 - 原生支持函数调用。 Mistral 还发布了一个新的优化模型 Mistral Small,针对延迟和成本进行了优化,其性能优于 Mixtral 8x7B,并且延迟较低,这使其成为开源型号和旗舰型号之间的中间解决方案。

封面图片

高通推出AI中心 允许开发人员在其应用程序中无缝实施模型

高通推出AI中心 允许开发人员在其应用程序中无缝实施模型 高通公司声称,人工智能中心基本上是应用程序开发人员的一个中心位置,在这里他们可以访问由该公司量化和验证的设备上人工智能模型。在撰写本文时,该中心支持超过 75 种人工智能模型。如果您是希望在应用程序中实施人工智能或生成式人工智能的开发人员,现在就可以访问aihub.qualcomm.com,选择您要实施的人工智能模型,然后选择目标平台,还可以进一步选择特定的设备,这使得 AI Hub 成为帮助开发人员成功、无缝地将人工智能应用到其应用程序中的同类产品之一。完成上述步骤后,Qualcomm AI Hub 将引导您找到正确的模型。该公司提到,开发人员只需几行代码就能将优化模型集成到他们的工作流程中。这些模型将涵盖图像分割、图像生成、图像分类、物体检测、超分辨率、文本生成、弱光增强和自然语言理解。至于 AI Hub 是否能在非骁龙芯片上运行,似乎也是可以的。不过,非骁龙芯片组将无法充分利用专用 AI 芯片的优势,这最终意味着开发人员必须付出更多努力,才能在非骁龙芯片组的设备上实现这一功能。 ... PC版: 手机版:

封面图片

Meta最新更新了它的代码生成人工智能模型Code Llama 70B,这是迄今为止“最大且表现最好的模型”。Code Llam

Meta最新更新了它的代码生成人工智能模型Code Llama 70B,这是迄今为止“最大且表现最好的模型”。Code Llama工具在八月份推出,无论是研究还是商业用途都是免费的。根据Meta的AI博客上的一篇文章,Code Llama 70B能够处理比以前版本更多的查询,这意味着开发者在编程时可以给它输入更多的提示,而且它的准确性可以更高。 Code Llama 70B在HumanEval基准测试中的准确率达到了53%,表现比GPT-3.5的48.1%要好,而且接近OpenAI论文报告的GPT-4的67%的成绩。 Code Llama是基于Llama 2构建的,它能帮助开发者根据提示生成代码串,并且调试人类编写的代码。去年秋天,Meta同时推出了另外两款Code Llama工具,分别是Code Llama - Python和Code Llama - Instruct,这两款工具专注于特定的编程语言。 Code Llama70B现在有三个版本的代码生成器可以使用,而且无论是研究还是商业用途都是免费的。这个大型模型是在1TB的代码和与代码相关的数据上进行训练的。它托管在代码库Hugging Face上,Hugging Face提供了GPU资源来运行人工智能模型。 Meta表示,它们的大型模型,34B和70B,“能够带来最佳效果,并提供更好的编码帮助。” 去年,其他人工智能开发者也发布了代码生成器。亚马逊的CodeWhisperer在四月份推出,而微软则利用OpenAI的模型推出了GitHub Copilot。 标签: #Meta #AI #Llama 频道: @GodlyNews1 投稿: @GodlyNewsBot

封面图片

Google发布了一对开源人工智能模型Gemma 2B和7B 适用于较小的任务

Google发布了一对开源人工智能模型Gemma 2B和7B 适用于较小的任务 不过,这些模型在复杂性上的不足,可能会在速度和使用成本上得到弥补。尽管规模较小,但Google声称,Gemma 模型"在关键基准测试中明显超越了更大的模型",并且"能够直接在开发人员的笔记本电脑或台式电脑上运行"。这些模型将通过 Kaggle、Hugging Face、NVIDIA 的 NeMo 和Google的 Vertex AI 提供。Gemma 进入开源生态系统的方式与 Gemini 的发布方式截然不同。虽然开发者可以在 Gemini 的基础上进行开发,但他们要么通过 API,要么在Google的 Vertex AI 平台上进行开发。Gemini 被认为是一种封闭的人工智能模式。通过将 Gemma 开源,更多的人可以尝试使用Google的人工智能,而不是转向提供更好访问权的竞争对手。无论组织规模、用户数量和项目类型如何,这两种尺寸的模型都将获得商业许可。不过,与其他公司一样,Google通常禁止将其模型用于武器开发项目等特定任务。Gemma 还将提供"负责任的人工智能工具包",因为开放模型比 Gemini 等封闭系统更难设置防护措施。Google DeepMind 产品管理总监特里斯-瓦肯汀说,"由于开放模型的固有风险,公司对 Gemma 进行了更广泛的重新设计"。负责任的人工智能工具包允许开发人员在项目中部署 Gemma 时创建自己的准则或禁用词列表。该工具包还包括一个模型调试工具,可让用户调查 Gemma 的行为并纠正问题。Warkentin 表示,这些模型目前最适用于英语语言相关任务,希望能与社区合作,满足英语任务以外的市场需求。开发人员可以在 Kaggle 中免费使用 Gemma,首次使用Google云的用户可以获得 300 美元的免费额度来使用模型。该公司表示,研究人员最多可申请 500000 美元的额度。虽然目前还不清楚人们对 Gemma 这样的小模型有多大需求,但其他人工智能公司也推出了重量更轻的旗舰基础模型。Meta 去年推出了 Llama 2 7B,这是 Llama 2 的最小迭代版本。 Gemini 本身也有几种重量,包括 Gemini Nano、Gemini Pro 和 Gemini Ultra,Google最近宣布推出速度更快的 Gemini 1.5,目前也是针对企业用户和开发人员。顺便说一下,Gemma 的意思是宝石。 ... PC版: 手机版:

封面图片

Google图像生成人工智能Imagen 3迎来升级

Google图像生成人工智能Imagen 3迎来升级 Google人工智能研究部门DeepMind负责人德米斯-哈萨比斯(Demis Hassabis)说,与前代产品Imagen 2相比,Imagen 3能更准确地理解文字提示,并将其转化为图像,而且在生成图像方面更具"创造性和细节"。此外,该模型产生的"干扰人工智能"和错误也更少。哈萨比斯补充说:"这也是我们目前渲染文本的最佳模型,而渲染文本一直是图像生成模型面临的挑战。"为了消除人们对深度伪造可能性的担忧,Google表示,Imagen 3 将使用 DeepMind 开发的SynthID 方法,在媒体上应用隐形加密水印。在Google的ImageFX工具中可以注册 Imagen 3 的私人预览版,Google表示,该模型将"很快"提供给使用Google企业生成式人工智能开发平台 Vertex AI 的开发人员和企业客户。Google通常不会透露太多用于训练人工智能模型的数据来源,这次也不例外。这是有原因的。大部分训练数据来自网络上的公共网站、资源库和数据集。而其中的一些训练数据,特别是未经内容创作者许可的受版权保护的数据,是知识产权相关诉讼的源头。Google的网站发布者控制功能允许网站管理员阻止搜索引擎与AI爬虫从他们的网站上获取数据,包括照片和视频。但是,Google并没有提供"退出"工具,而且与某些竞争对手不同的是,Google并没有承诺对权利人(在某些情况下是在不知情的情况下)为训练数据集做出的贡献进行补偿。缺乏透明度并不令人惊讶,但令人失望的尤其是像Google这样拥有丰富资源的公司。 ... PC版: 手机版:

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人