xAI 发布 Grok-1.5 视觉能力预览

X旗下的AI公司xAI宣布隆重推出Grok-1.5V,其第一代多模式模型。除了强大的文本功能之外,Grok现在还可以处理各种视觉信息,包括文档、图表、屏幕截图和照片。Grok-1.5V很快就会向早期测试者和现有Grok用户推出。Grok-1.5V在多个领域(从多学科推理到理解文档、科学图表、图表、屏幕截图和照片)与现有的前沿多模态模型具有竞争力。xAI表示,我们对Grok理解物理世界的能力感到特别兴奋。Grok在我们新的RealWorldQA基准测试中表现优于同行。标签:#Grok#AI频道:@GodlyNews1投稿:@GodlyNewsBot

相关推荐

封面图片

【xAI发布支持视觉的多模态AI模型Grok-1.5V】

【xAI发布支持视觉的多模态AI模型Grok-1.5V】2024年04月13日05点09分老不正经报道,马斯克旗下人工智能公司xAI宣布推出首个多模态AI模型Grok-1.5V。除了强大的文本处理能力,Grok还能够处理各种视觉信息,包括文档、图表、屏幕截图和照片等。在多个领域的基准测试中,Grok-1.5V的表现均可与现有的前沿多模态模型相媲美。尤其在xAI新推出的RealWorldQA基准测试中,Grok在现实世界空间理解能力上超越了同类模型。RealWorldQA数据集包含700多张图像,旨在评估多模态模型对物理世界的基本理解能力。Grok-1.5将很快向早期测试人员和现有用户开放。

封面图片

xAI 推出具有视觉能力的 Grok 1.5 Vision 大模型

xAI推出具有视觉能力的Grok1.5Vision大模型马斯克旗下的xAI推出了其首款多模态大模型Grok1.5Vision。除了文本功能外,Grok现在还可以处理各种各样的视觉信息,包括文档、图表、图表、屏幕截图、照片,并能进行多学科推理。xAI重点展示了Grok-1.5V的7个示例,包括:将手绘图表转换成Python代码、看食品标签计算卡路里、根据孩子的绘画讲个睡前故事、解释梗图、将表格转换成csv格式、解答生活日常问题、解决代码问题。——

封面图片

xAI 第一代多模态模型 Grok 1.5V 推出

xAI第一代多模态模型Grok1.5V推出Grok-1.5V在多个领域(从多学科推理到理解文档、科学图表、图表、屏幕截图和照片)与现有的前沿多模态模型具有竞争力。在新的RealWorldQA基准测试中表现优于同行,该基准评估多模态模型的现实空间理解能力。接下来的几个月中,xAI将在图像、音频和视频等各种模式上对这两种功能进行重大改进。线索:@ZaiHuabot投稿:@TNSubmbot频道:@TestFlightCN

封面图片

xAI 推出首个多模态 AI 模型 Grok-1.5V

xAI推出首个多模态AI模型Grok-1.5V马斯克旗下人工智能公司xAI宣布推出首个多模态AI模型Grok-1.5V。除了强大的文本处理能力,Grok还能够处理各种视觉信息,包括文档、图表、屏幕截图和照片等。在多个领域的基准测试中,Grok-1.5V的表现均可与现有的前沿多模态模型相媲美。尤其在xAI新推出的RealWorldQA基准测试中,Grok在现实世界空间理解能力上超越了同类模型。RealWorldQA数据集包含700多张图像,旨在评估多模态模型对物理世界的基本理解能力。Grok-1.5将很快向早期测试人员和现有用户开放。

封面图片

马斯克 xAI 展示首个多模态模型 Grok-1.5V:可将流程图转成 Python 代码

马斯克xAI展示首个多模态模型Grok-1.5V:可将流程图转成Python代码马斯克旗下人工智能公司xAI于3月下旬推出Grok-1.5大语言模型之后,近日再次推出首个多模态模型。xAI表示将于近期邀请早期测试者和现有的Grok用户测试Grok-1.5Vision(Grok-1.5V),不仅能理解文本,还能处理文档、图表、截图和照片中的内容。Grok-1.5V在多学科推理、文档理解、科学图表、表格处理、屏幕截图和照片等多个领域都能媲美现有的前沿多模态模型。xAI在官方新闻稿中演示了7个Grok-1.5V案例,,包括将白板上的流程图草图转化为Python代码、根据孩子的绘画生成睡前故事、解释流行语、将表格转化为CSV文件格式等等。来源,频道:@kejiqu群组:@kejiquchat

封面图片

马斯克的 xAI 正在努力使 Grok 成为多模态人工智能

人工智能公司xAI正在取得进展,根据公开的开发者文档,他们正在为其Grok聊天机器人增加多模态输入功能。这意味着不久后,用户可能可以上传照片到Grok,并获得基于文本的回答。上个月,xAI在一篇博客文章中首次透露,Grok-1.5V将提供“多个领域的多模态模型”。开发者文档的最新更新似乎显示了推出新模型的进展。在开发者文档中,有一个示Python脚本示例展示了开发者如何使用xAI软件开发工具包库来生成基于文本和图片的响应。这个脚本读取一个图片文件,设置一个文本提示,并使用xAISDK来生成响应。这个模型是根据X公司博客文章的说法,通过互联网上公开可获得的各种文本数据以及截至2023年第三季度的数据集进行训练的,这些数据集经过...人工审查和策划。博客还补充说,Grok-1并没有使用X公司的数据(包括公开的X帖子)进行训练。然而,Grok确实拥有包括X帖子在内的“实时世界知识”。标签:#xAI#Grok频道:@GodlyNews1投稿:@GodlyNewsBot

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人