马斯克的 xAI 正在努力使 Grok 成为多模态人工智能

人工智能公司xAI正在取得进展，根据公开的开发者文档，他们正在为其Grok聊天机器人增加多模态输入功能。这意味着不久后，用户可能可以上传照片到Grok，并获得基于文本的回答。上个月，xAI在一篇博客文章中首次透露，Grok-1.5V将提供“多个领域的多模态模型”。开发者文档的最新更新似乎显示了推出新模型的进展。在开发者文档中，有一个示Python脚本示例展示了开发者如何使用xAI软件开发工具包库来生成基于文本和图片的响应。这个脚本读取一个图片文件，设置一个文本提示，并使用xAISDK来生成响应。这个模型是根据X公司博客文章的说法，通过互联网上公开可获得的各种文本数据以及截至2023年第三季度的数据集进行训练的，这些数据集经过...人工审查和策划。博客还补充说，Grok-1并没有使用X公司的数据（包括公开的X帖子）进行训练。然而，Grok确实拥有包括X帖子在内的“实时世界知识”。标签:#xAI#Grok频道:@GodlyNews1投稿:@GodlyNewsBot

在Telegram中查看

相关推荐

马斯克 xAI 展示首个多模态模型 Grok-1.5V：可将流程图转成 Python 代码

马斯克xAI展示首个多模态模型Grok-1.5V：可将流程图转成Python代码马斯克旗下人工智能公司xAI于3月下旬推出Grok-1.5大语言模型之后，近日再次推出首个多模态模型。xAI表示将于近期邀请早期测试者和现有的Grok用户测试Grok-1.5Vision（Grok-1.5V），不仅能理解文本，还能处理文档、图表、截图和照片中的内容。Grok-1.5V在多学科推理、文档理解、科学图表、表格处理、屏幕截图和照片等多个领域都能媲美现有的前沿多模态模型。xAI在官方新闻稿中演示了7个Grok-1.5V案例，，包括将白板上的流程图草图转化为Python代码、根据孩子的绘画生成睡前故事、解释流行语、将表格转化为CSV文件格式等等。来源，频道：@kejiqu群组：@kejiquchat

人工智能公司 xAI 开源 Grok-1 模型

人工智能公司xAI开源Grok-1模型3月11日，埃隆·马斯克表示xAI将开源其AI聊天机器人Grok，目前已在GitHub上提供开放源代码版本，这将使研究人员和开发人员能够在该模型的基础上进行构建。该公司的一篇博客文章解释说，这个开放版本包括“3140亿参数专家混合模型Grok-1”的“基本模型权重和网络架构”。博文还称，该模型来自去年10月的检查点，并且没有“针对任何特定应用(例如对话)”进行微调。该模型以Apache2.0许可证发布，允许商业用途。——、、

xAI 推出首个多模态 AI 模型 Grok-1.5V

xAI推出首个多模态AI模型Grok-1.5V马斯克旗下人工智能公司xAI宣布推出首个多模态AI模型Grok-1.5V。除了强大的文本处理能力，Grok还能够处理各种视觉信息，包括文档、图表、屏幕截图和照片等。在多个领域的基准测试中，Grok-1.5V的表现均可与现有的前沿多模态模型相媲美。尤其在xAI新推出的RealWorldQA基准测试中，Grok在现实世界空间理解能力上超越了同类模型。RealWorldQA数据集包含700多张图像，旨在评估多模态模型对物理世界的基本理解能力。Grok-1.5将很快向早期测试人员和现有用户开放。

马斯克旗下人工智能初创公司推出首个AI模型Grok

马斯克旗下人工智能初创公司推出首个AI模型Grok美国企业家马斯克旗下人工智能（AI）初创公司xAI推出了首款AI模型Grok，Grok能实时连接社交媒体平台X（前称推特）。新华社报道，马斯克星期天（11月5日）在X平台发布和转发多条动态，宣介这一AI模型。据xAI团队介绍，目前Grok仍处于早期测试阶段，现在每周都在迭代进步。Grok可以回答几乎任何问题，甚至能启发用户提出问题。此外，这个AI模型“有智慧，还有一点小叛逆”，所以它的使用者最好不是讨厌幽默的人。据介绍，Grok能通过X平台了解实时世界，也可以回答一些其他AI系统拒绝回答的棘手问题。马斯克说，相比其他生成式AI，与X平台实时连接，获得对这个世界的实时认知，是Grok拥有的巨大优势。不过，也有媒体对此提出质疑，认为社媒平台上可能存在大量虚假或未经认证的实时信息。Grok一词源自科幻小说《异乡异客》，在书中意为深刻而直观地理解事物。xAI公司成立于今年7月，由马斯克领导，并与X平台、特斯拉等马斯克旗下的企业密切协作。2023年11月6日1:44PM

【xAI发布支持视觉的多模态AI模型Grok-1.5V】

【xAI发布支持视觉的多模态AI模型Grok-1.5V】2024年04月13日05点09分老不正经报道，马斯克旗下人工智能公司xAI宣布推出首个多模态AI模型Grok-1.5V。除了强大的文本处理能力，Grok还能够处理各种视觉信息，包括文档、图表、屏幕截图和照片等。在多个领域的基准测试中，Grok-1.5V的表现均可与现有的前沿多模态模型相媲美。尤其在xAI新推出的RealWorldQA基准测试中，Grok在现实世界空间理解能力上超越了同类模型。RealWorldQA数据集包含700多张图像，旨在评估多模态模型对物理世界的基本理解能力。Grok-1.5将很快向早期测试人员和现有用户开放。

xAI 发布 Grok-1.5 视觉能力预览

X旗下的AI公司xAI宣布隆重推出Grok-1.5V，其第一代多模式模型。除了强大的文本功能之外，Grok现在还可以处理各种视觉信息，包括文档、图表、屏幕截图和照片。Grok-1.5V很快就会向早期测试者和现有Grok用户推出。Grok-1.5V在多个领域（从多学科推理到理解文档、科学图表、图表、屏幕截图和照片）与现有的前沿多模态模型具有竞争力。xAI表示，我们对Grok理解物理世界的能力感到特别兴奋。Grok在我们新的RealWorldQA基准测试中表现优于同行。标签:#Grok#AI频道:@GodlyNews1投稿:@GodlyNewsBot

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人