Meta的新AI功能可以将文字提示变成视频

Meta的新AI功能可以将文字提示变成视频 虽然效果相当粗糙,但该系统让人们看到了人工智能在该领域的未来步伐,它是今年引起广泛关注的文本到图像人工智能系统的明显进步。 Meta公司宣布的Make-A-Video尚未向公众开放,这可能会促使其他人工智能实验室发布自己的版本。这也提出了一些重大的道德问题。 仅在上个月,人工智能实验室OpenAI就向所有人提供了其最新的文本-图像人工智能系统DALL-E,而人工智能初创公司Stability.AI则推出了稳定的开源的文本-图像系统。 但文本到视频的AI伴随着一些更大的挑战。首先,这些模型需要大量的计算能力。它们比大型文本到图像的人工智能模型的计算量还要大,后者使用数百万张图像进行训练,因为仅仅拼凑一个短视频就需要数百张图像。这意味着在可预见的未来,只有大型科技公司才有能力建立这些系统。它们的训练也比较棘手,因为没有大规模的高质量视频与文本配对的数据集。

相关推荐

封面图片

Meta发布AI广告新功能 可以自动生成各种图文

Meta发布AI广告新功能 可以自动生成各种图文 Meta商业化业务负责人约翰·海格曼(John Hegeman)表示,公司还在研究如何对生成的广告进行标记,并会在新工具在全球范围内上线时公布指导方针,时间可能在今年年底左右。在宣布这一消息时,Meta正投入上百亿美元开发和支持生成式人工智能模型,同时试图说服广告商,通过自动化广告活动创意方面的工作,他们可以获得更大回报。今年2月份,数字广告巨头谷歌宣布了类似的人工智能广告工具计划。谷歌表示,公司人工智能工具制作的广告将使用旗下人工智能研究实验室DeepMind开发的SynthID水印技术进行标记。有了Meta的图像生成工具,广告商可以上传产品照片并生成各种相关图像,比如可以调整产品的摆放角度或向人们展示如何在不同环境下使用它们。新工具还增加了可以生成图像标题和产品关键卖点的文本生成功能,同时还能将文本直接加到自动生成的图像上。Meta表示,将在未来几个月增加一个功能,可以让广告商通过输入文本提示来定制各种图像。广告商纷纷接纳可以自动针对不同用户群体投放不同内容的人工智能广告工具,但对较新的生成式人工智能工具则表现出更多犹豫。比如一些品牌对科技公司如何使用自己上传的图像来改进模型持保留态度,担心品牌标志或其他知识产权可能会出现在别人生成的图像中。 ... PC版: 手机版:

封面图片

大模型有望迎新突破 OpenAI、Meta将推出拥有“推理”功能的AI

大模型有望迎新突破 OpenAI、Meta将推出拥有“推理”功能的AI 本周,OpenAI和Meta的高管表示,两家公司正准备推出其大型语言模型的下一个版本,这些模型为生成式人工智能应用提供动力。Meta表示,将在未来几周内开始推出Llama 3;而OpenAI则表示,它的下一个型号,预计将被称为GPT-5,将“很快推出”。推理功能Meta人工智能研究副总裁Joelle Pineau表示,“我们正在努力弄清楚如何让这些模型不仅能说话,而且能真正进行推理和规划……拥有记忆。”OpenAI首席运营官Brad Lightcap在接受采访时表示,下一代GPT将在解决推理等“难题”方面取得进展,“我们将开始看到人工智能能够以更精密的方式处理更复杂的任务,我认为,我们才刚刚开始触及这些模型推理能力的表层。”Lightcap补充道,如今的人工智能系统“非常擅长一次性的小任务”,但其能力仍然“相当有限”。为AGI铺路伴随着科技公司间越来越“卷”技术,进步的步伐正在加快,它们竞相创造更复杂的生成式人工智能这种模型可以创造出与人类无异的文字、图像、代码和视频,其质量也在不断提高。今年,Google、Anthropic和Cohere等公司陆续发布了一波新的大语言模型。推理和规划功能便是通往“通用人工智能(AGI)”的必经之路。AGI拥有人类水平的认知,它允许聊天机器人和虚拟助手完成相关任务的序列,并预测其行为的后果。Meta首席人工智能科学家Yann LeCun周二(4月9日)在伦敦的一次活动上表示,目前的人工智能系统“在没有思考和计划的情况下,是一个接一个地生成单词”,他们很难处理复杂的问题或长时间记住信息,因此他们仍然会“犯愚蠢的错误”。他表示,增加推理能力意味着人工智能模型将“搜索可能的答案”、“计划行动的顺序”,并建立一个“关于其行动将产生何种影响的心理模型”。LeCun补充道,这正是目前模型的重要缺失部分,而这些能力将使机器达到下一个智能水平。OpenAI的Lightcap则表示,OpenAI很快就会对下一个版本的GPT“有更多话要说”。Lightcap称,“我认为随着时间的推移,我们将看到这些模型走向更长、更复杂的任务,这就要求他们提高推理能力。” ... PC版: 手机版:

封面图片

Meta 推出独立的人工智能图像生成器,目前免费但只支持英文提示词

Meta 推出独立的人工智能图像生成器,目前免费但只支持英文提示词 Meta 在网页上推出了一种新的、独立的生成式人工智能体验「」,它允许用户通过用自然语言描述图像来创建图像。 新的人工图像生成器由 Meta 现有的 Emu 图像生成模型提供支持,可根据文本提示创建高分辨率图像。 它目前对美国的英语用户免费使用,并且每个提示都会生成四个图像。

封面图片

苹果与Meta讨论建立AI合作伙伴关系

苹果与Meta讨论建立AI合作伙伴关系 据知情人士透露,Facebook的母公司Meta已与苹果公司就将Meta的生成式人工智能模型整合到最近发布的用于iPhone和其他设备的人工智能系统Apple Intelligence中进行了讨论。除了谷歌和Meta,人工智能初创公司Anthropic和Perplexity也一直在与苹果商谈,希望把它们的生成式人工智能引入苹果智能系统。

封面图片

Meta发布开源AI工具AudioCraft,可帮助用户创作音乐和音频

Meta发布开源AI工具AudioCraft,可帮助用户创作音乐和音频 美东时间周三,Meta发布了一款开源人工智能(AI)工具 ,该工具可以帮助用户根据文本提示创作音乐和音频。Meta表示,这款人工智能工具将AudioGen、EnCodec和MusicGen三种模型或技术融为一炉,可用文本内容生成高质量、逼真的音频和音乐。来源 , 来自:雷锋 频道:@kejiqu 群组:@kejiquchat 投稿:@kejiqubot

封面图片

Meta在其App搜索栏中添加了由基于Llama 3模型的AI机器人

Meta在其App搜索栏中添加了由基于Llama 3模型的AI机器人 此外,公司还推出了一个新的meta.ai网站,供用户访问聊天机器人。这一消息凸显了Meta公司在当前消费者热衷于使用人工智能生成工具的背景下,努力确立自己的地位。马克-扎克伯格(Mark Zuckerberg)追随市场上其他流行服务(如 OpenAI 的服务),今天声称 Meta AI 可能是"你可以自由使用的最智能的人工智能助手"。Meta去年首次在美国推出了 Meta AI。现在,它正在澳大利亚、加拿大、加纳、牙买加、马拉维、新西兰、尼日利亚、巴基斯坦 、新加坡、南非、乌干达、赞比亚和津巴布韦等十多个国家推广英语聊天机器人 。该公司上周开始在印度和尼日利亚等国测试Meta AI,但值得注意的是,这些国家没有出现在今天的公告中。Meta 表示,它计划在印度保持 Meta AI 的测试模式。"我们将继续从印度的用户测试中学习。正如我们对许多人工智能产品和功能所做的那样,我们会在不同阶段和有限的范围内对它们进行公开测试,"该公司发言人在一份声明中说。用户已经可以向 Meta AI 咨询写作或食谱建议。现在,他们还可以询问由Google和必应提供的网络相关结果。该公司表示,图像生成的速度也在加快。此外,用户还可以要求 Meta AI 为图像制作动画,或将图像转化为 GIF。用户可以在输入时看到人工智能工具实时修改图片。该公司还致力于提高人工智能生成的照片的图像质量。人工智能驱动的图像生成工具一直不擅长拼写单词。Meta 声称,它的新模型在这方面也有所改进。Meta 采用的方法是在尽可能多的地方提供 Meta AI。它在搜索栏、个人和群组聊天中,甚至在 Feed 中都提供了机器人。用户可以提出与各自 Facebook feed 中的帖子相关的问题。例如,如果你看到一张极光的照片,就可以向 Meta AI 提出建议,询问什么是去冰岛看北极光的最佳时间。Meta AI 已经可以在雷朋智能眼镜上使用,该公司表示很快也将在 Meta Quest 头衔上使用。在许多地方使用人工智能也有其弊端。具体来说,人工智能模型可能会产生"幻觉",做出随机的、通常是无意义的回应,因此在多个平台上使用人工智能可能会成为内容审核的噩梦。相关文章:Meta发布Llama 3 称其是目前最好的开放式模型之一 ... PC版: 手机版:

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人