马斯克的 xAI 正在努力使 Grok 成为多模态人工智能
人工智能公司xAI正在取得进展,根据公开的开发者文档,他们正在为其Grok聊天机器人增加多模态输入功能。这意味着不久后,用户可能可以上传照片到Grok,并获得基于文本的回答。上个月,xAI在一篇博客文章中首次透露,Grok-1.5V将提供“多个领域的多模态模型”。开发者文档的最新更新似乎显示了推出新模型的进展。在开发者文档中,有一个示Python脚本示例展示了开发者如何使用xAI软件开发工具包库来生成基于文本和图片的响应。这个脚本读取一个图片文件,设置一个文本提示,并使用xAISDK来生成响应。这个模型是根据X公司博客文章的说法,通过互联网上公开可获得的各种文本数据以及截至2023年第三季度的数据集进行训练的,这些数据集经过...人工审查和策划。博客还补充说,Grok-1并没有使用X公司的数据(包括公开的X帖子)进行训练。然而,Grok确实拥有包括X帖子在内的“实时世界知识”。标签:#xAI#Grok频道:@GodlyNews1投稿:@GodlyNewsBot