Meta 推出 LLM Compiler 代码优化模型，可搭配其他 AI 改善代码生成 / 编译能力

Meta推出LLMCompiler代码优化模型，可搭配其他AI改善代码生成/编译能力Meta前天推出了一款名为“LLMCompiler”的模型，该模型基于Meta现有的CodeLlama打造，主打代码优化，目前相关模型已登陆HuggingFace，提供70亿参数及130亿参数两个版本，允许学术及商业使用。Meta认为，尽管业界各大语言模型已在各种编程代码任务中展现了出色的能力，但此类模型在代码优化还有进步空间，目前推出的LLMCompiler模型便是一款专为优化代码任务设计的预训练模型，能够模拟编译器对代码进行优化，或将“已经过优化的代码转换回原本的语言”。LLMCompiler在 5460亿个LLVM-IR和汇编代码标记的庞大语料库上进行了训练，据称能够达到77%的“代码优化潜力”，开发者可以自由将相关模型配合其他 AI 模型一起使用，从而改善生成代码的质量。关注频道@ZaiHuaPd频道爆料@ZaiHuabot

在Telegram中查看

相关推荐

英伟达联合推出 StarCoder2 模型：生成、补全、调试代码一气呵成

英伟达联合推出StarCoder2模型：生成、补全、调试代码一气呵成英伟达联合HuggingFace和ServiceNow，发布了名为的LLMs系列模型，希望成为代码生成领域的新标准，具备性能、透明度和成本效益等诸多优势。该系列模型包括一个由ServiceNow训练的30亿参数模型、一个由HuggingFace训练的70亿参数模型和一个由英伟达训练的150亿参数模型。这是通过使用名为Stackv2的新代码数据集实现的，该数据集比Stackv1大七倍；新的训练技术也意味着该模型可以更好地理解COBOL等低资源编程语言、数学和程序源代码讨论。StarCoder2经过619门编程语言培训，可以执行源代码生成、工作流生成、文本摘要等专业任务。英伟达表示，开发人员可以利用它进行代码补全、高级代码总结、代码片段检索等，从而提高工作效率。StarCoder2采用BigCodeOpenRAIL-M许可证，允许免版税访问和使用。https://github.com/bigcode-project/starcoder2https://huggingface.co/bigcode频道：@kejiqu群组：@kejiquchat

帮开发者构建生成式 AI 应用，Meta 和微软合作推出开源模型 Llama 2

帮开发者构建生成式AI应用，Meta和微软合作推出开源模型Llama2Meta和微软近日合作推出Llama2，这是Meta公司的下一代开源大型语言模型，可以免费用于研究和商业用途。微软在新闻稿中表示，Llama2旨在帮助开发者和组织，构建生成式人工智能工具和体验。Azure客户可以在Azure平台上更轻松、更安全地微调和部署7B、13B和70B参数的Llama2模型，此外通过优化可以在Windows本地运行。Llama2模型与AzureAI的结合使开发人员能够利用AzureAI的强大工具进行模型训练、微调、推理，特别是支持AI安全的功能。微软表示在Windows中加入Llama2模型，有助于推动Windows成为开发人员根据客户需求构建人工智能体验的最佳场所，并释放他们使用WindowsSubsystemforLinux(WSL)、Windows终端、MicrosoftVisualStudio和VSCode等世界级工具进行构建的能力。——、、

Hugging Face 和 ServiceNow 发布免费代码生成模型 StarCoder

HuggingFace和ServiceNow发布免费代码生成模型StarCoderAI创业公司HuggingFace和ServiceNow发布了免费的代码生成模型。类似DeepMind的AlphaCode、亚马逊的CodeWhisperer和GitHub的Copilot(基于OpenAI的Codex)，StarCoder使用ApacheLicense2.0许可证，允许任何人免费使用，但严格意义上不是开源模型，它禁止用户使用该模型生成或传播恶意代码。StarCoder使用了开源代码数据集TheStack训练，有150亿参数。其数据集包括了逾80种不同编程语言和来自githubissues和commits的文本。#AI来源，https://github.com/bigcode-project/starcoder来自：雷锋频道：@kejiqu群组：@kejiquchat投稿：@kejiqubot

IBM 开源 Granite 代码模型

IBM开源Granite代码模型IBM开源了它用于辅助编程的代码模型，源代码托管在GitHub上，采用ApacheLicense2.0许可证，允许商业使用。与其它AI模型不同的是，IBM致力于避免模型的版权问题，使用了开放数据集如GitHubCodeClean、Starcoder、开放代码库和GitHubissues等进行训练。Granite是decoder-only代码模型，可用于修bug、解释代码和生成代码文档，使用了116种编程语言的代码进行训练，参数规模30亿、80亿、200亿和340亿。IBM称测试显示Granite在开源代码模型中表现最出色。来源，频道：@kejiqu群组：@kejiquchat

Meta 推出 80 亿参数和 700 亿参数的 Llama 3 模型

Meta推出80亿参数和700亿参数的Llama3模型据Meta旗下AIatMeta官方在X平台发文表示，Meta正式发布了Llama3包括80亿参数和700亿参数在内的2个模型。该模型实现了新功能，例如改进的推理能力，并为特定模型设定了新的最先进水平。在接下来的几个月中，我们预计将推出新功能、更长的上下文窗口、额外的模型大小和增强的性能+Llama3研究论文，供社区从我们的工作中学习。

Meta官宣深入AI大战推出先进大型语言模型

Meta官宣深入AI大战推出先进大型语言模型扎克伯格在社交媒体上称，FacebookAIResearch研发的LLaMA是“目前水平最高的”大型语言模型，目标是帮助研究人员推进他们在人工智能（AI）领域的工作。“大型语言模型”（LLM）可以消化大量的文本数据，并推断文本的单词之间的关系。随着计算能力的进步，以及输入数据集与参数空间的不断扩大，LLM的能力也相应提高。目前，LLM已经被证明能高效地执行多种任务，包括文本生成、问题回答、书面材料总结等。扎克伯格称，LLM在自动证明数学定理、预测蛋白质结构等更复杂的方面也有很大的发展前景。值得一提的是，近期大火的ChatGPT就是采用LLM构建的聊天机器人。ChatGPT由GPT3.5提供支持，而GPT3.5是一款基于OpenAI175B参数基础模型训练的LLM，175B是它从训练数据中所学习、沉淀下来的内容。Meta在官网介绍中称，LLaMA有7B、13B、33B和65B四个基础模型，在大多数基准测试中都优于GPT3.5的前身GPT3-175B，而LLaMA-65B可与业内最佳的Chinchilla-70B和PaLM-540B竞争。Meta还宣布，将针对学术研究者共享其模型，正在接受研究人员的申请。与之截然不同的是，Google旗下的DeepMind和OpenAI并不公开训练代码。根据2021年媒体的一份调查显示，AI专家们通常将DeepMind、OpenAI和FAIR（FacebookAIResearch）视为该领域的“前三甲”。去年年底，Meta发布了另一款名为Galactica的模型，但因经常分享偏见和不准确的信息而遭到下架。...PC版：https://www.cnbeta.com.tw/articles/soft/1346305.htm手机版：https://m.cnbeta.com.tw/view/1346305.htm

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人