阿里巴巴开源 1100 亿参数 Qwen1.5-110B 模型,与 Meta Llama3-70B 相媲美 - IT之家

None

相关推荐

封面图片

Meta 开源最新的 Llama 3.1 大模型

Meta 开源最新的 Llama 3.1 大模型 其它科技公司都想把 AI 产品买给你们,但扎克伯格(Mark Zuckerberg)选择免费送给你们。Meta 周一宣布了其最新的 Llama 3.1 大模型,其最大规模版本的参数有 4050 亿个,较小规模的版本有 700 亿和 80 亿个参数。Meta 称,Llama 3.1 在基准测试中的表现超过了 OpenAI 的 GPT-4o 和 Anthropic 的 Claude 3.5 Sonnet。Meta 表示,Llama 3.1 使用了逾 16,000 个英伟达 H100 GPU 进行训练,它认为相比私有大模型,部署成本会更低。扎克伯格称他与世界各地的开发者、企业和政府官员交流时,他们都表达了不希望被私有封闭供应商锁定的愿望,希望自己能控制模型,而 Llama 3.1 将能满足他们的要求。 via Solidot

封面图片

Meta发布功能更强大的Code Llama 70B模型 可与GitHub Copilot相媲美

Meta发布功能更强大的Code Llama 70B模型 可与GitHub Copilot相媲美 Code Llama 70B 已在 5000 亿个字节的代码和相关数据基础上进行了训练。它可以处理和生成较长的代码序列,这要归功于 10 万个词组的上下文窗口。据 Meta 公司介绍,Code Llama 70B 使用一种称为自我关注的技术来理解代码结构。它可以根据文本或片段提示实现算法、排序、搜索等功能,适用于 Python、C++、Javascript 和 Java 等多种语言。这款人工智能驱动的工具包括针对特定任务进行微调的变体。其中一个变体是 CodeLlama-70B-Instruct,它经过训练可以理解自然语言指令。还有一个以 Python 为重点的版本,名为 CodeLlama-70B-Python。根据 Meta 的说法,通过对 1000 亿个 Python 代码标记的额外训练,它生成 Python 代码的"流畅性和准确性无与伦比"。"编写和编辑代码已成为当今人工智能模型最重要的用途之一,"Meta 公司首席执行官马克-扎克伯格在 Facebook 上的一篇文章中写道。"事实证明,代码能力对于人工智能模型更严谨、更合乎逻辑地处理其他领域的信息也非常重要。"Code Llama 70B可以在与早期 Code Llama 模型相同的开放许可下免费下载: 公司称,这种许可允许学术和商业用户修改模型。微软旗下的GitHub于 2023 年 7 月推出了 Copilot Chat。开发人员可以就自己的代码向 Copilot 提问,获得代码特定部分的解释,甚至让 Copilot 修复代码中的错误。最近,Google也推出了 Duet AI 和 Gemini Pro,这是由人工智能驱动的代码完成和生成工具。 ... PC版: 手机版:

封面图片

重磅!Meta推出开源大模型Llama ,性能直逼GPT-

封面图片

帮开发者构建生成式 AI 应用,Meta 和微软合作推出开源模型 Llama 2 - IT之家

封面图片

Meta宣布推出Llama 2(羊驼2) 提供7B~70B模型 开源免费可商用

Meta宣布推出Llama 2(羊驼2) 提供7B~70B模型 开源免费可商用 今天 Meta 发布 Llama 2 也就是羊驼 2 模型,提供 7B、13B 和 70B 参数版本,该模型开源、免费、可商用,这也是为什么最近一段时间有大量新模型出现,对开源社区来说,只要有高质量模型被开源出来,那接下来就是社区成员登场,微调、优化、定制、整合,然后就可以生成更多模型了。 羊驼 2 预训练模型接受了 2 万亿个 tokens 的训练,上下文长度是 Llama 1 的两倍,是的其上下文长度从 2048 提升到了 4096,其微调模型接受了超过 100 万个人类标注的训练。 根据 Meta AI 研究团队的测试,羊驼 2 在不少测试中表现都比较优异 (相对其他开源模型),包括推理、编程、熟练程度和知识测试。 (需要提供Email地址) 来源 , 来自:雷锋 频道:@kejiqu 群组:@kejiquchat 投稿:@kejiqubot

封面图片

【阿里巴巴发布两款开源人工智能模型】

【阿里巴巴发布两款开源人工智能模型】 科技巨头阿里巴巴集团于8月3日宣布,其云计算部门发布了两个开源人工智能(AI)模型。它的两个大型语言模型(LLM)被称为Qwen-7B和Qwen-7B-Chat,每个模型都有70亿个参数。 新模型旨在帮助将人工智能引入中小型企业的运营中。该公司表示,Qwen-7B和Qwen-7B-Chat具有对企业有吸引力的各种功能,例如能够“全世界的学者、研究人员和商业机构可以免费访问代码、模型权重和文档”。 8月1日,该公司还宣布对其AnalyticDB数据仓库服务进行矢量引擎更新,这将允许其企业客户快速创建定制的生成式AI应用程序。 快讯/广告 联系 @xingkong888885

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人