马斯克发布Grok-1.5V xAI首款多模态大模型能看图写代码、算热量

马斯克发布Grok-1.5V xAI首款多模态大模型能看图写代码、算热量 xAI重点展示了Grok-1.5V的7个示例，包括：将手绘图表转换成Python代码、看食品标签计算卡路里、根据孩子的绘画讲个睡前故事、解释梗图、将表格转换成csv格式、为生活日常问题答疑解惑、解决代码问题。至此，xAI正式加入前沿多模态大模型的竞赛。与GPT-4V、Claude 3 Sonnet、Claude 3 Opus、Gemini Pro 1.5相比，Grok-1.5V的表现不相上下，在一些基准测试中略胜一筹。尤其是在RealWorld，用于衡量真实世界空间理解能力的QA基准测试中，Grok明显优于同类模型。xAI团队对Grok理解物理世界的能力感到特别兴奋。对于上面的数据集，该团队在没有思维链提示的情况下在零样本设置中评估Grok。xAI宣布向社区发布RealWorldQA基准测试，计划随着其多模态模型的改进而扩展它。RealWorldQA在CC BY-ND 4.0下发布，数据集大小为677MB。初版RealWorldQA由700多张图片组成，每张图片都有一个问题和易于验证的答案。该数据集包括从汽车上拍摄的匿名图像，以及其他真实世界的图像。xAI放出了4个示例，其中有两张图都是由汽车前置摄像头拍摄的。数据集地址：https://creativecom “当然！您提供的流程图描述了一个简单的猜谜游戏，其中计算机生成一个随机数，用户必须猜测它。下面是表示流程图中逻辑的Python代码：”“这段代码将运行流程图中描述的猜谜游戏。用户将被提示输入他们的猜测，直到他们猜对了数字。”2、计算卡路里用户问：“5片这个有多少卡路里？”Grok回复：“如果一份是3片，含有60卡路里，那么5片就含有大约100卡路里。这是通过首先确定每片的卡路里来计算的：60卡路里/3片=每片20卡路里。然后，将每片的卡路里乘以片数：每片20卡路里*5片= 100卡路里。”3、根据绘画讲一个睡前故事根据上图，Grok讲出这样一个睡前故事：“很久很久以前，在一片充满冒险和奇迹的土地上，有一个勇敢的小男孩，名叫蒂米。蒂米和他的家人住在一个舒适的小房子里，他最喜欢的就是探索周围的世界。在一个阳光明媚的日子，蒂米决定去附近的森林探险。他带上了他最喜欢的零食、一个指南针，还有他那本可靠的笔记本，用来画下他将要看到的所有令人兴奋的事情。当蒂米向森林深处冒险时，他发现了一条在阳光下闪闪发光的神奇河流。这条河是如此迷人，以至于蒂米决定造一艘小纸船，作为对森林精灵的特殊信息，顺流而下。蒂米小心翼翼地折起他的纸船，在上面画了一个笑脸，给森林精灵带来欢乐。然后，他把船放在河上，看着它漂走，带着他的友谊和对自然的爱的信息。当太阳开始下山时，蒂米知道是时候回家了。他很感激在森林里度过的神奇的一天，他知道他会永远把这次冒险的记忆记在心里。回到家，蒂米把他的故事告诉了他的家人，他们很高兴听到他在森林里神奇的一天。他们都认为提米的勇敢和善良的精神是一个真正的鼓舞，他们知道他将继续有更多的奇妙的冒险在未来。于是，带着一颗充满爱的心和一个充满梦想的头脑，蒂米慢慢地睡着了，渴望发现在他想象的世界里有什么新的冒险在等着他。”4、解释一个梗图给Grok上面这张梗图，它也能“秒懂”：“这张图片是对初创公司和大公司的幽默比较。在左边标有‘初创公司’的地方，有一群人在一起挖洞。他们都在积极参与，这个洞已经相当深了。在右边标有‘大公司’的地方，有一群人站在一个洞周围。然而，与创业方不同的是，实际上只有一个人在挖洞，而其他人则在观看或从事其他活动。这幅图中的幽默来自于对初创公司和大公司之间差异的夸大。在创业公司，通常有一种紧迫感，每个人都被期望直接为手头的任务做出贡献。相比之下，大公司通常被描述为有更多的官僚主义，并且每个项目中所有团队成员的直接参与较少。”5、将表格转换成csv用户可以要求Grok将这张表格转换成csv。Grok随即输出以纯文本格式显示的CSV。6、帮忙清理甲板上的烂木头Grok也能用于解决生活日常问题。当用户发送一张照片，询问：“这些洞出现在我甲板上的螺丝周围。它烂了吗？我应该换电路板吗？”Grok回复说：“看来你甲板上的木头已经开始腐烂了。螺丝周围有洞表明了这一点，这是木头腐烂的常见迹象。为确保甲板的安全和使用寿命，建议更换受影响的甲板。这将有助于防止甲板进一步受损，并保持其结构完整性。如果您不确定如何继续更换板，咨询专业的甲板建造商或承包商可能会有所帮助。他们将能够评估损坏的程度，并为您的甲板提供最佳行动方案的专家建议。”7、解决代码问题让Grok写Python代码解决上面的问题，Grok的输出如下：xAI团队认为，推进其多模态理解和生成能力是构建能够理解宇宙的有益AGI的重要步骤。在接下来的几个月里，xAI预计将在图像、音频、视频等各种模态上对这两种功能进行重大改进。同时，xAI还贴出招聘链接，邀请更多设计师、工程师、产品、数据、Infra、AI导师加入。值得一提的是，LLaVA一作、美国威斯康星大学麦迪逊分校博士柳昊天今日宣布加入xAI团队：“我很高兴和一个小而专注的团队一起工作，看看我们能有多快！这仅仅是个开始。” ... PC版：手机版：

在Telegram中查看

相关推荐

马斯克 xAI 展示首个多模态模型 Grok-1.5V：可将流程图转成 Python 代码

马斯克 xAI 展示首个多模态模型 Grok-1.5V：可将流程图转成 Python 代码马斯克旗下人工智能公司 xAI 于 3 月下旬推出 Grok-1.5 大语言模型之后，近日再次推出首个多模态模型。 xAI 表示将于近期邀请早期测试者和现有的 Grok 用户测试 Grok-1.5 Vision（Grok-1.5V），不仅能理解文本，还能处理文档、图表、截图和照片中的内容。Grok-1.5V 在多学科推理、文档理解、科学图表、表格处理、屏幕截图和照片等多个领域都能媲美现有的前沿多模态模型。 xAI 在官方新闻稿中演示了 7 个 Grok-1.5V 案例，，包括将白板上的流程图草图转化为 Python 代码、根据孩子的绘画生成睡前故事、解释流行语、将表格转化为 CSV 文件格式等等。来源，频道：@kejiqu 群组：@kejiquchat

xAI 推出具有视觉能力的 Grok 1.5 Vision 大模型

xAI 推出具有视觉能力的 Grok 1.5 Vision 大模型马斯克旗下的 xAI 推出了其首款多模态大模型 Grok 1.5 Vision 。除了文本功能外， Grok 现在还可以处理各种各样的视觉信息，包括文档、图表、图表、屏幕截图、照片，并能进行多学科推理。 xAI 重点展示了 Grok-1.5V 的7个示例，包括：将手绘图表转换成 Python 代码、看食品标签计算卡路里、根据孩子的绘画讲个睡前故事、解释梗图、将表格转换成 csv 格式、解答生活日常问题、解决代码问题。

xAI 推出 Grok-1.5 大语言模型

xAI 推出 Grok-1.5 大语言模型马斯克旗下的人工智能公司 xAI 今天在官方博客中宣布，正式推出 Grok-1.5 大语言模型。Grok-1.5 具有改进的推理能力和 128k 的上下文长度。Grok-1.5 最显著的改进之一是其在编码和数学相关任务中的表现。Grok-1.5 将在未来几天内在平台上向早期测试人员和现有的 Grok 用户推出。

马斯克 xAI 公布大型语言模型 Grok

马斯克 xAI 公布大型语言模型 Grok Grok 是一款模仿《银河系漫游指南》的AI，因此几乎可以回答任何问题。它会机智地回答问题且有叛逆倾向，讨厌幽默的人可能不适合它。它还将回答大多数AI会拒绝的尖锐问题。 xAI 先是训练了330亿参数的原型模型 Grok-0，接着在过去两个月训练出了 Grok-1。初始版本上下文支持8192个 token。未来将添加其它感官如视觉和听觉。预训练数据截至2023年第三季度，根本优势是可以通过 X/Twitter 实时了解世界信息流。推理和编码基准测试中：Grok-1 强过 GPT-3.5，弱于 PaLM 2 (Bard)、Claude 2、GPT-4。《2023年5月匈牙利全国高中数学考试》测试中 (防止AI"背题")： 1. GPT-4 (68%) 2. Grok-1 (59%) 3. Claude-2 (55%) 4. GPT-3.5 (41%) 5. Grok-0 (37%)

马斯克宣布xAI将在8月份推出Grok-2大模型预计年底推出Grok-3

马斯克宣布xAI将在8月份推出Grok-2大模型预计年底推出Grok-3 除此之外，马斯克还表示，他计划在年底推出的一款大型人工智能模型Grok-0将使用10万块英伟达的H100进行训练，并有可能超越现有人工智能水平并激发全球用户对AI技术的兴趣。尽管成立时间不长，但xAI在人工智能领域已经取得了令人瞩目的进展。去年7月13日才宣布成立的该公司，在不到一年的时间里就完成了首个旗舰模型Grok-0的训练，参数量达到330亿。随后，他们又先后推出了Grok-1、Grok-1.5和Grok-1.5V等多款产品。目前发布的这些多款Grok模型虽然间隔时间很短，但功能逐渐增强。其中，3月28日发布的Grok-1.5增加了长文本处理能力；4月12日发布的 G rok -1 .5 V 增加了视觉推理能力，可以根据自然语言和图像交错进行推理。除了在产品上的卓越成就外，xAI在资本市场上也获得了认可。他们在5月26日在官网上宣布从B轮融资中筹集了60亿美元资金，投资者包括红杉资本、安德森·霍洛维茨基金、富达管理与研究公司以及沙特王国控股公司等。 ... PC版：手机版：

人工智能公司 xAI 开源 Grok-1 模型

人工智能公司 xAI 开源 Grok-1 模型 3月11日，埃隆·马斯克表示 xAI 将开源其 AI 聊天机器人 Grok ，目前已在 GitHub 上提供开放源代码版本，这将使研究人员和开发人员能够在该模型的基础上进行构建。该公司的一篇博客文章解释说，这个开放版本包括“3140亿参数专家混合模型 Grok-1”的“基本模型权重和网络架构”。博文还称，该模型来自去年10月的检查点，并且没有“针对任何特定应用 (例如对话) ”进行微调。该模型以Apache 2.0 许可证发布，允许商业用途。、、

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人