Meta开源多感官人工智能模型ImageBind,整合文本、音频等数据

None

相关推荐

封面图片

微软、谷歌和Meta押注于假数据来训练人工智能模型。

封面图片

阿联酋发布“猎鹰”人工智能模型挑战 Meta、OpenAI

阿联酋发布“猎鹰”人工智能模型挑战Meta、OpenAIFalcon是一个大型语言模型,类似于OpenAI的GPT和Google的双子座(Gemini)--为聊天机器人、图像生成器和其他生成式人工智能工具提供动力的计算系统。Falcon于2023年首次推出,它是开源的,这意味着它的代码可以广泛共享。据猎鹰背后的阿布扎比集团技术创新研究所(TII)称,猎鹰的新版本猎鹰211B比MetaPlatforms公司最新推出的同类开源模型更强大,在某些指标上与双子座不相上下。先进技术研究委员会(TII的出资政府实体)秘书长费萨尔-班奈(FaisalAlBannai)在接受采访时说:"我们能够实现比许多大公司更高的性能。而我们的计算能力和团队规模只是他们的一小部分。"阿拉伯联合酋长国正在自上而下齐心协力地推动人工智能的发展,将这项技术视为继石油之后的下一个经济支柱。这个海湾国家推出了一系列新业务和一个可能达到1000亿美元的人工智能投资工具。虽然阿联酋和沙特阿拉伯已经宣布了雄心勃勃的人工智能投资计划,但这两个海湾国家不得不引进大量的工程专业知识,并且刚刚开始将生成式人工智能工具应用到企业中。去年秋天,TII称其第一版Falcon的下载量超过1200万次。Meta公司表示,其最新的Llama模型获得了1.7亿次下载。去年11月,先进技术研究委员会(AdvancedTechnologyResearchCouncil)宣布成立AI71公司,这是一家致力于将Falcon商业化的新公司。AlBannai说,AI71已经开始与阿联酋的合作伙伴一起在医院、律师事务所和呼叫中心试用这项技术,并计划很快扩展到国外。他拒绝透露政府为开发Falcon投入了多少资金,但他说,一个由大约60名研究人员组成的团队正在为TII开发几项人工智能服务。据TII称,新版Falcon支持五种欧洲语言和"视觉转语言功能"--一种能让计算机将图像流畅地转换成文本的工具。据AlBannai称,这种能力是阿布扎比为Falcon设计的某些商业应用的关键。他说:"分析某人胸部的X光片、分析教育文件、分析建筑文件--我们正试图将重点放在能够产生重大影响的非常明确的企业用例上。"这位官员说,今后,人工智能系统的开发将由一个新组织负责,名为猎鹰基金会(FalconFoundation),以非营利性软件机构Linux基金会为蓝本。阿尔-班奈说,这将包括一个章程,以确保猎鹰"永远保持开源"。他说,该模型的另一个版本将在未来两个月内发布。本周一早些时候,阿布扎比人工智能公司G42(该公司的支持者之一是微软公司)为其阿拉伯语人工智能聊天机器人Jais发布了一款新应用。...PC版:https://www.cnbeta.com.tw/articles/soft/1430740.htm手机版:https://m.cnbeta.com.tw/view/1430740.htm

封面图片

OpenAI 推出文本到视频人工智能模型 Sora

OpenAI推出文本到视频人工智能模型Sora根据OpenAI的介绍博文,Sora能够创建"具有多个角色、特定运动类型以及主体和背景准确细节的复杂场景"。该公司还指出,该模型能够理解物体"在物理世界中的存在方式",还能"准确解释道具并生成表达生动情感的引人注目的角色"。该模型还能根据静态图像生成视频,以及在现有视频中填充缺失的帧或扩展视频。OpenAI的博文中包含的Sora生成的演示包括淘金热时期加利福尼亚州的空中场景、从东京火车内部拍摄的视频等。许多演示都有人工智能的痕迹--比如在一段博物馆的视频中,地板疑似在移动。OpenAI表示,该模型"可能难以准确模拟复杂场景的物理现象",但总体而言,演示结果令人印象深刻。几年前,像Midjourney这样的文本到图像生成器在模型将文字转化为图像的能力方面处于领先地位。但最近,视频技术开始飞速进步:Runway和Pika等公司都展示了自己令人印象深刻的文字转视频模型,而Google的Lumiere也将成为OpenAI在这一领域的主要竞争对手之一。与Sora类似,Lumiere也为用户提供了文字转换视频的工具,还能让用户通过静态图像创建视频。Sora目前只对"红队"人员开放,他们负责评估模型的潜在危害和风险。OpenAI还向一些视觉艺术家、设计师和电影制片人提供访问权限,以获得反馈意见。它指出,现有模型可能无法准确模拟复杂场景的物理现象,也可能无法正确解释某些因果关系。本月早些时候,OpenAI宣布将在其文本到图像工具DALL-E3中添加水印,但指出这些水印"很容易去除"。与其他人工智能产品一样,OpenAI将不得不面对人工智能逼真视频被误认为是真实视频的后果。...PC版:https://www.cnbeta.com.tw/articles/soft/1418385.htm手机版:https://m.cnbeta.com.tw/view/1418385.htm

封面图片

人工智能公司 xAI 开源 Grok-1 模型

人工智能公司xAI开源Grok-1模型3月11日,埃隆·马斯克表示xAI将开源其AI聊天机器人Grok,目前已在GitHub上提供开放源代码版本,这将使研究人员和开发人员能够在该模型的基础上进行构建。该公司的一篇博客文章解释说,这个开放版本包括“3140亿参数专家混合模型Grok-1”的“基本模型权重和网络架构”。博文还称,该模型来自去年10月的检查点,并且没有“针对任何特定应用(例如对话)”进行微调。该模型以Apache2.0许可证发布,允许商业用途。——、、

封面图片

免费试用:GoogleGemini是DeepMind开发的一种多模态人工智能模型,可以处理文本、音频、图像等多种类型的数据

封面图片

Meta人工智能主管:大型语言模型不会达到人类智能水平Meta的人工智能主管杨立昆(YannLeCun)表示,为ChatGPT等

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人