马斯克的 xAI 正在努力使 Grok 成为多模态人工智能

人工智能公司xAI正在取得进展,根据公开的开发者文档,他们正在为其Grok聊天机器人增加多模态输入功能。这意味着不久后,用户可能可以上传照片到Grok,并获得基于文本的回答。上个月,xAI在一篇博客文章中首次透露,Grok-1.5V将提供“多个领域的多模态模型”。开发者文档的最新更新似乎显示了推出新模型的进展。在开发者文档中,有一个示Python脚本示例展示了开发者如何使用xAI软件开发工具包库来生成基于文本和图片的响应。这个脚本读取一个图片文件,设置一个文本提示,并使用xAISDK来生成响应。这个模型是根据X公司博客文章的说法,通过互联网上公开可获得的各种文本数据以及截至2023年第三季度的数据集进行训练的,这些数据集经过...人工审查和策划。博客还补充说,Grok-1并没有使用X公司的数据(包括公开的X帖子)进行训练。然而,Grok确实拥有包括X帖子在内的“实时世界知识”。标签:#xAI#Grok频道:@GodlyNews1投稿:@GodlyNewsBot

相关推荐

封面图片

马斯克 xAI 展示首个多模态模型 Grok-1.5V:可将流程图转成 Python 代码

马斯克xAI展示首个多模态模型Grok-1.5V:可将流程图转成Python代码马斯克旗下人工智能公司xAI于3月下旬推出Grok-1.5大语言模型之后,近日再次推出首个多模态模型。xAI表示将于近期邀请早期测试者和现有的Grok用户测试Grok-1.5Vision(Grok-1.5V),不仅能理解文本,还能处理文档、图表、截图和照片中的内容。Grok-1.5V在多学科推理、文档理解、科学图表、表格处理、屏幕截图和照片等多个领域都能媲美现有的前沿多模态模型。xAI在官方新闻稿中演示了7个Grok-1.5V案例,,包括将白板上的流程图草图转化为Python代码、根据孩子的绘画生成睡前故事、解释流行语、将表格转化为CSV文件格式等等。来源,频道:@kejiqu群组:@kejiquchat

封面图片

人工智能公司 xAI 开源 Grok-1 模型

人工智能公司xAI开源Grok-1模型3月11日,埃隆·马斯克表示xAI将开源其AI聊天机器人Grok,目前已在GitHub上提供开放源代码版本,这将使研究人员和开发人员能够在该模型的基础上进行构建。该公司的一篇博客文章解释说,这个开放版本包括“3140亿参数专家混合模型Grok-1”的“基本模型权重和网络架构”。博文还称,该模型来自去年10月的检查点,并且没有“针对任何特定应用(例如对话)”进行微调。该模型以Apache2.0许可证发布,允许商业用途。——、、

封面图片

xAI 推出首个多模态 AI 模型 Grok-1.5V

xAI推出首个多模态AI模型Grok-1.5V马斯克旗下人工智能公司xAI宣布推出首个多模态AI模型Grok-1.5V。除了强大的文本处理能力,Grok还能够处理各种视觉信息,包括文档、图表、屏幕截图和照片等。在多个领域的基准测试中,Grok-1.5V的表现均可与现有的前沿多模态模型相媲美。尤其在xAI新推出的RealWorldQA基准测试中,Grok在现实世界空间理解能力上超越了同类模型。RealWorldQA数据集包含700多张图像,旨在评估多模态模型对物理世界的基本理解能力。Grok-1.5将很快向早期测试人员和现有用户开放。

封面图片

马斯克旗下人工智能初创公司推出首个AI模型Grok

马斯克旗下人工智能初创公司推出首个AI模型Grok美国企业家马斯克旗下人工智能(AI)初创公司xAI推出了首款AI模型Grok,Grok能实时连接社交媒体平台X(前称推特)。新华社报道,马斯克星期天(11月5日)在X平台发布和转发多条动态,宣介这一AI模型。据xAI团队介绍,目前Grok仍处于早期测试阶段,现在每周都在迭代进步。Grok可以回答几乎任何问题,甚至能启发用户提出问题。此外,这个AI模型“有智慧,还有一点小叛逆”,所以它的使用者最好不是讨厌幽默的人。据介绍,Grok能通过X平台了解实时世界,也可以回答一些其他AI系统拒绝回答的棘手问题。马斯克说,相比其他生成式AI,与X平台实时连接,获得对这个世界的实时认知,是Grok拥有的巨大优势。不过,也有媒体对此提出质疑,认为社媒平台上可能存在大量虚假或未经认证的实时信息。Grok一词源自科幻小说《异乡异客》,在书中意为深刻而直观地理解事物。xAI公司成立于今年7月,由马斯克领导,并与X平台、特斯拉等马斯克旗下的企业密切协作。2023年11月6日1:44PM

封面图片

【xAI发布支持视觉的多模态AI模型Grok-1.5V】

【xAI发布支持视觉的多模态AI模型Grok-1.5V】2024年04月13日05点09分老不正经报道,马斯克旗下人工智能公司xAI宣布推出首个多模态AI模型Grok-1.5V。除了强大的文本处理能力,Grok还能够处理各种视觉信息,包括文档、图表、屏幕截图和照片等。在多个领域的基准测试中,Grok-1.5V的表现均可与现有的前沿多模态模型相媲美。尤其在xAI新推出的RealWorldQA基准测试中,Grok在现实世界空间理解能力上超越了同类模型。RealWorldQA数据集包含700多张图像,旨在评估多模态模型对物理世界的基本理解能力。Grok-1.5将很快向早期测试人员和现有用户开放。

封面图片

xAI 发布 Grok-1.5 视觉能力预览

X旗下的AI公司xAI宣布隆重推出Grok-1.5V,其第一代多模式模型。除了强大的文本功能之外,Grok现在还可以处理各种视觉信息,包括文档、图表、屏幕截图和照片。Grok-1.5V很快就会向早期测试者和现有Grok用户推出。Grok-1.5V在多个领域(从多学科推理到理解文档、科学图表、图表、屏幕截图和照片)与现有的前沿多模态模型具有竞争力。xAI表示,我们对Grok理解物理世界的能力感到特别兴奋。Grok在我们新的RealWorldQA基准测试中表现优于同行。标签:#Grok#AI频道:@GodlyNews1投稿:@GodlyNewsBot

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人