xAI 发布 Grok-1.5 视觉能力预览

X旗下的AI公司xAI宣布隆重推出Grok-1.5V，其第一代多模式模型。除了强大的文本功能之外，Grok现在还可以处理各种视觉信息，包括文档、图表、屏幕截图和照片。Grok-1.5V很快就会向早期测试者和现有Grok用户推出。Grok-1.5V在多个领域（从多学科推理到理解文档、科学图表、图表、屏幕截图和照片）与现有的前沿多模态模型具有竞争力。xAI表示，我们对Grok理解物理世界的能力感到特别兴奋。Grok在我们新的RealWorldQA基准测试中表现优于同行。标签:#Grok#AI频道:@GodlyNews1投稿:@GodlyNewsBot

在Telegram中查看

相关推荐

【xAI发布支持视觉的多模态AI模型Grok-1.5V】

【xAI发布支持视觉的多模态AI模型Grok-1.5V】2024年04月13日05点09分老不正经报道，马斯克旗下人工智能公司xAI宣布推出首个多模态AI模型Grok-1.5V。除了强大的文本处理能力，Grok还能够处理各种视觉信息，包括文档、图表、屏幕截图和照片等。在多个领域的基准测试中，Grok-1.5V的表现均可与现有的前沿多模态模型相媲美。尤其在xAI新推出的RealWorldQA基准测试中，Grok在现实世界空间理解能力上超越了同类模型。RealWorldQA数据集包含700多张图像，旨在评估多模态模型对物理世界的基本理解能力。Grok-1.5将很快向早期测试人员和现有用户开放。

xAI 推出具有视觉能力的 Grok 1.5 Vision 大模型

xAI推出具有视觉能力的Grok1.5Vision大模型马斯克旗下的xAI推出了其首款多模态大模型Grok1.5Vision。除了文本功能外，Grok现在还可以处理各种各样的视觉信息，包括文档、图表、图表、屏幕截图、照片，并能进行多学科推理。xAI重点展示了Grok-1.5V的7个示例，包括：将手绘图表转换成Python代码、看食品标签计算卡路里、根据孩子的绘画讲个睡前故事、解释梗图、将表格转换成csv格式、解答生活日常问题、解决代码问题。——

xAI 第一代多模态模型 Grok 1.5V 推出

xAI第一代多模态模型Grok1.5V推出Grok-1.5V在多个领域(从多学科推理到理解文档、科学图表、图表、屏幕截图和照片)与现有的前沿多模态模型具有竞争力。在新的RealWorldQA基准测试中表现优于同行，该基准评估多模态模型的现实空间理解能力。接下来的几个月中，xAI将在图像、音频和视频等各种模式上对这两种功能进行重大改进。线索：@ZaiHuabot投稿：@TNSubmbot频道：@TestFlightCN

xAI 推出首个多模态 AI 模型 Grok-1.5V

xAI推出首个多模态AI模型Grok-1.5V马斯克旗下人工智能公司xAI宣布推出首个多模态AI模型Grok-1.5V。除了强大的文本处理能力，Grok还能够处理各种视觉信息，包括文档、图表、屏幕截图和照片等。在多个领域的基准测试中，Grok-1.5V的表现均可与现有的前沿多模态模型相媲美。尤其在xAI新推出的RealWorldQA基准测试中，Grok在现实世界空间理解能力上超越了同类模型。RealWorldQA数据集包含700多张图像，旨在评估多模态模型对物理世界的基本理解能力。Grok-1.5将很快向早期测试人员和现有用户开放。

马斯克 xAI 展示首个多模态模型 Grok-1.5V：可将流程图转成 Python 代码

马斯克xAI展示首个多模态模型Grok-1.5V：可将流程图转成Python代码马斯克旗下人工智能公司xAI于3月下旬推出Grok-1.5大语言模型之后，近日再次推出首个多模态模型。xAI表示将于近期邀请早期测试者和现有的Grok用户测试Grok-1.5Vision（Grok-1.5V），不仅能理解文本，还能处理文档、图表、截图和照片中的内容。Grok-1.5V在多学科推理、文档理解、科学图表、表格处理、屏幕截图和照片等多个领域都能媲美现有的前沿多模态模型。xAI在官方新闻稿中演示了7个Grok-1.5V案例，，包括将白板上的流程图草图转化为Python代码、根据孩子的绘画生成睡前故事、解释流行语、将表格转化为CSV文件格式等等。来源，频道：@kejiqu群组：@kejiquchat

马斯克的 xAI 正在努力使 Grok 成为多模态人工智能

人工智能公司xAI正在取得进展，根据公开的开发者文档，他们正在为其Grok聊天机器人增加多模态输入功能。这意味着不久后，用户可能可以上传照片到Grok，并获得基于文本的回答。上个月，xAI在一篇博客文章中首次透露，Grok-1.5V将提供“多个领域的多模态模型”。开发者文档的最新更新似乎显示了推出新模型的进展。在开发者文档中，有一个示Python脚本示例展示了开发者如何使用xAI软件开发工具包库来生成基于文本和图片的响应。这个脚本读取一个图片文件，设置一个文本提示，并使用xAISDK来生成响应。这个模型是根据X公司博客文章的说法，通过互联网上公开可获得的各种文本数据以及截至2023年第三季度的数据集进行训练的，这些数据集经过...人工审查和策划。博客还补充说，Grok-1并没有使用X公司的数据（包括公开的X帖子）进行训练。然而，Grok确实拥有包括X帖子在内的“实时世界知识”。标签:#xAI#Grok频道:@GodlyNews1投稿:@GodlyNewsBot

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人