人工智能公司 xAI 开源 Grok-1 模型

人工智能公司 xAI 开源 Grok-1 模型 3月11日,埃隆·马斯克表示 xAI 将开源其 AI 聊天机器人 Grok ,目前已在 GitHub 上提供开放源代码版本,这将使研究人员和开发人员能够在该模型的基础上进行构建。该公司的一篇博客文章解释说,这个开放版本包括“3140亿参数专家混合模型 Grok-1”的“基本模型权重和网络架构”。博文还称,该模型来自去年10月的检查点,并且没有“针对任何特定应用 (例如对话) ”进行微调。该模型以Apache 2.0 许可证发布,允许商业用途。 、、

相关推荐

封面图片

埃隆马斯克按承诺开源xAi的Grok模型 参数达314B允许商业性用途

埃隆马斯克按承诺开源xAi的Grok模型 参数达314B允许商业性用途 此前埃隆马斯克已经承诺将会把 xAi 公司开发的 Grok 人工智能开源,目前 Grok 已经在 X/Twitter 中上线,如果用户开通 X Premium + 订阅的话,则可以免费使用 Grok。Grok 主要目标是提供人工智能对话、编程开发、创意写作等,同时它可以实时连接 X 获取数据,例如查询某个 X 用户发布的内容等。 此次开源的 Grok 模型参数高达 314B,公开版本为 314B 参数的混合专家模型 Grok-1 的基础模型权重和网络架构,该版本来自 2023 年 10 月的一个检查点,之后没有经过针对任何特定应用例如对话方面的微调。 许可证方面 Grok-1 采用 Apache 2.0 许可证发布,该许可证允许商业用途,这意味着其他公司可以基于该模型分析、研究、重新发布其他模型。来源 , 地址: 频道:@kejiqu 群组:@kejiquchat

封面图片

马斯克 xAI 公布大型语言模型 Grok

马斯克 xAI 公布大型语言模型 Grok Grok 是一款模仿《银河系漫游指南》的AI,因此几乎可以回答任何问题。它会机智地回答问题且有叛逆倾向,讨厌幽默的人可能不适合它。它还将回答大多数AI会拒绝的尖锐问题。 xAI 先是训练了330亿参数的原型模型 Grok-0,接着在过去两个月训练出了 Grok-1。初始版本上下文支持8192个 token。未来将添加其它感官如视觉和听觉。预训练数据截至2023年第三季度,根本优势是可以通过 X/Twitter 实时了解世界信息流。 推理和编码基准测试中:Grok-1 强过 GPT-3.5,弱于 PaLM 2 (Bard)、Claude 2、GPT-4。 《2023年5月匈牙利全国高中数学考试》测试中 (防止AI"背题"): 1. GPT-4 (68%) 2. Grok-1 (59%) 3. Claude-2 (55%) 4. GPT-3.5 (41%) 5. Grok-0 (37%)

封面图片

马斯克旗下人工智能初创公司推出首个AI模型Grok

马斯克旗下人工智能初创公司推出首个AI模型Grok 美国企业家马斯克旗下人工智能(AI)初创公司xAI推出了首款AI模型Grok,Grok能实时连接社交媒体平台X(前称推特)。 新华社报道,马斯克星期天(11月5日)在X平台发布和转发多条动态,宣介这一AI模型。据xAI团队介绍,目前Grok仍处于早期测试阶段,现在每周都在迭代进步。 Grok可以回答几乎任何问题,甚至能启发用户提出问题。此外,这个AI模型“有智慧,还有一点小叛逆”,所以它的使用者最好不是讨厌幽默的人。 据介绍,Grok能通过X平台了解实时世界,也可以回答一些其他AI系统拒绝回答的棘手问题。马斯克说,相比其他生成式AI,与X平台实时连接,获得对这个世界的实时认知,是Grok拥有的巨大优势。不过,也有媒体对此提出质疑,认为社媒平台上可能存在大量虚假或未经认证的实时信息。 Grok一词源自科幻小说《异乡异客》,在书中意为深刻而直观地理解事物。 xAI公司成立于今年7月,由马斯克领导,并与X平台、特斯拉等马斯克旗下的企业密切协作。 2023年11月6日 1:44 PM

封面图片

xAI 推出 Grok-1.5 大语言模型

xAI 推出 Grok-1.5 大语言模型 马斯克旗下的人工智能公司 xAI 今天在官方博客中宣布,正式推出 Grok-1.5 大语言模型。Grok-1.5 具有改进的推理能力和 128k 的上下文长度。Grok-1.5 最显著的改进之一是其在编码和数学相关任务中的表现。Grok-1.5 将在未来几天内在 平台上向早期测试人员和现有的 Grok 用户推出。

封面图片

人工智能公司 xAI 正在取得进展,根据公开的开发者文档,他们正在为其 Grok 聊天机器人增加多模态输入功能。这意味着不久后,

人工智能公司 xAI 正在取得进展,根据公开的开发者文档,他们正在为其 Grok 聊天机器人增加多模态输入功能。这意味着不久后,用户可能可以上传照片到 Grok,并获得基于文本的回答。 上个月,xAI 在一篇博客文章中首次透露,Grok-1.5V 将提供“多个领域的多模态模型”。开发者文档的最新更新似乎显示了推出新模型的进展。 在开发者文档中,有一个示Python 脚本示例展示了开发者如何使用 xAI 软件开发工具包库来生成基于文本和图片的响应。这个脚本读取一个图片文件,设置一个文本提示,并使用 xAI SDK 来生成响应。 这个模型是根据 X 公司博客文章的说法,通过互联网上公开可获得的各种文本数据以及截至 2023 年第三季度的数据集进行训练的,这些数据集经过...人工审查和策划。博客还补充说,Grok-1 并没有使用 X 公司的数据(包括公开的 X 帖子)进行训练。然而,Grok 确实拥有包括 X 帖子在内的“实时世界知识”。 标签: #xAI #Grok 频道: @GodlyNews1 投稿: @GodlyNewsBot

封面图片

马斯克用行动反击 开源自家顶级大模型 压力给到OpenAI

马斯克用行动反击 开源自家顶级大模型 压力给到OpenAI 有意思的是,Grok-1宣布开源的封面图为Midjourney生成,可谓“AI helps AI”。一直吐槽OpenAI不open的马斯克,自然要在社交平台上含沙射影一番,“我们想了解更多OpenAI的开放部分。”Grok-1遵照Apache 2.0协议开放模型权重和架构。这意味着它允许用户自由地使用、修改和分发软件,无论是个人还是商业用途。这种开放性鼓励了更广泛的研究和应用开发。项目发布至今,已经在GitHub上揽获6.5k星标,热度还在持续增加。项目说明中明确强调,由于Grok-1是一个规模较大(314B参数)的模型,需要有足够GPU内存的机器才能使用示例代码测试模型。网友表示这可能需要一台拥有628 GB GPU内存的机器。此外,该存储库中MoE层的实现效率并不高,之所以选择该实现是为了避免需要自定义内核来验证模型的正确性。目前已开源的热门大模型包括Meta的Llama2、法国的Mistral等。通常来说,发布开源模型有助于社区展开大规模的测试和反馈,意味着模型本身的迭代速度也能加快。Grok-1是一个混合专家(Mixture-of-Experts,MOE)大模型,由马斯克旗下的AI创企xAI在过去4个月里开发。回顾该模型的开发历程:在宣布成立xAI之后,相关研究人员首先训练了一个330亿参数的原型语言模型(Grok-0),这个模型在标准语言模型测试基准上接近LLaMA2(70B)的能力,但使用了更少的训练资源;之后,研究人员对模型的推理和编码能力进行了重大改进,最终开发出了Grok-1并于2023年11月发布,这是一款功能更为强大的SOTA语言模型,在HumanEval编码任务中达到了63.2%的成绩,在MMLU中达到了73%,超过了其计算类中的所有其他模型,包括ChatGPT-3.5和Inflection-1。与其他大模型相比,Grok-1的优势在哪呢?xAI特别强调,Grok-1是他们自己从头训练的大模型,即从2023年10月开始使用自定义训练堆栈在JAX和Rust上训练,没有针对特定任务(如对话)进行微调;Grok-1的一个独特而基本的优势是,它可以通过X平台实时了解世界,这使得它能够回答被大多数其他AI系统拒绝的辛辣问题。Grok-1发布版本所使用的训练数据来自截至2023年第三季度的互联网数据和xAI的AI训练师提供的数据;3140亿参数的Mixture-of-Experts模型,其对于每个token,活跃权重比例为25%,这一庞大的参数量为其提供了强大的语言理解和生成能力。xAI此前介绍,Grok-1将作为Grok背后的引擎,用于自然语言处理任务,包括问答、信息检索、创意写作和编码辅助。未来,长上下文的理解与检索、多模态能力都是该模型将会探索的方向之一。 ... PC版: 手机版:

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人