Meta的新AI功能可以将文字提示变成视频

Meta的新AI功能可以将文字提示变成视频虽然效果相当粗糙，但该系统让人们看到了人工智能在该领域的未来步伐，它是今年引起广泛关注的文本到图像人工智能系统的明显进步。Meta公司宣布的Make-A-Video尚未向公众开放，这可能会促使其他人工智能实验室发布自己的版本。这也提出了一些重大的道德问题。仅在上个月，人工智能实验室OpenAI就向所有人提供了其最新的文本-图像人工智能系统DALL-E，而人工智能初创公司Stability.AI则推出了稳定的开源的文本-图像系统。但文本到视频的AI伴随着一些更大的挑战。首先，这些模型需要大量的计算能力。它们比大型文本到图像的人工智能模型的计算量还要大，后者使用数百万张图像进行训练，因为仅仅拼凑一个短视频就需要数百张图像。这意味着在可预见的未来，只有大型科技公司才有能力建立这些系统。它们的训练也比较棘手，因为没有大规模的高质量视频与文本配对的数据集。——

在Telegram中查看

相关推荐

大模型有望迎新突破 OpenAI、Meta将推出拥有“推理”功能的AI

大模型有望迎新突破OpenAI、Meta将推出拥有“推理”功能的AI本周，OpenAI和Meta的高管表示，两家公司正准备推出其大型语言模型的下一个版本，这些模型为生成式人工智能应用提供动力。Meta表示，将在未来几周内开始推出Llama3；而OpenAI则表示，它的下一个型号，预计将被称为GPT-5，将“很快推出”。推理功能Meta人工智能研究副总裁JoellePineau表示，“我们正在努力弄清楚如何让这些模型不仅能说话，而且能真正进行推理和规划……拥有记忆。”OpenAI首席运营官BradLightcap在接受采访时表示，下一代GPT将在解决推理等“难题”方面取得进展，“我们将开始看到人工智能能够以更精密的方式处理更复杂的任务，我认为，我们才刚刚开始触及这些模型推理能力的表层。”Lightcap补充道，如今的人工智能系统“非常擅长一次性的小任务”，但其能力仍然“相当有限”。为AGI铺路伴随着科技公司间越来越“卷”技术，进步的步伐正在加快，它们竞相创造更复杂的生成式人工智能——这种模型可以创造出与人类无异的文字、图像、代码和视频，其质量也在不断提高。今年，Google、Anthropic和Cohere等公司陆续发布了一波新的大语言模型。推理和规划功能便是通往“通用人工智能（AGI）”的必经之路。AGI拥有人类水平的认知，它允许聊天机器人和虚拟助手完成相关任务的序列，并预测其行为的后果。Meta首席人工智能科学家YannLeCun周二（4月9日）在伦敦的一次活动上表示，目前的人工智能系统“在没有思考和计划的情况下，是一个接一个地生成单词”，他们很难处理复杂的问题或长时间记住信息，因此他们仍然会“犯愚蠢的错误”。他表示，增加推理能力意味着人工智能模型将“搜索可能的答案”、“计划行动的顺序”，并建立一个“关于其行动将产生何种影响的心理模型”。LeCun补充道，这正是目前模型的重要缺失部分，而这些能力将使机器达到下一个智能水平。OpenAI的Lightcap则表示，OpenAI很快就会对下一个版本的GPT“有更多话要说”。Lightcap称，“我认为随着时间的推移，我们将看到这些模型走向更长、更复杂的任务，这就要求他们提高推理能力。”...PC版：https://www.cnbeta.com.tw/articles/soft/1426868.htm手机版：https://m.cnbeta.com.tw/view/1426868.htm

Meta推出独立AI图像生成器“Imagine with Meta”

Meta推出独立AI图像生成器“ImaginewithMeta”与OpenAI的DALL-E、Midjourney和StableDiffusion类似，ImaginewithMeta由Meta现有的Emu图像生成模型提供支持，可根据文本提示创建高分辨率图像。它对美国用户免费使用（至少目前是免费的），每个提示可生成四幅图像。"我们很高兴听到人们介绍他们如何使用MetaAI的文本到图片生成功能imagine在聊天中制作有趣和有创意的内容。今天，我们将扩大想象功能在聊天之外的使用范围，"Meta在今天上午发布的一篇博文中写道。"虽然我们的信息体验是专为更有趣的来回互动而设计的，但你现在也可以在网络上创建免费图片了。现在，Meta的图片生成工具已经让该公司最近陷入了水深火热之中（例如Meta被指提供了有种族偏见的人工智能贴纸生成器），这让人怀疑ImaginewithMeta是否有防止历史重演的保障措施。水印并不是一开始就有的，但Meta承诺将在未来几周内开始为ImaginewithMeta生成的内容添加水印，以"提高透明度和可追溯性"。Meta表示，这些水印是不可见的，将通过人工智能模型生成，并通过相应的模型进行检测。至于检测模型是否会在某个时候公开，目前还没有消息。"[水印]能够抵御常见的图像处理，如裁剪、调整大小、颜色变化（亮度、对比度等）、屏幕截图、图像压缩、噪音、贴纸叠加等，"Meta在帖子中说。"我们的目标是在未来将隐形水印技术应用到我们许多带有人工智能生成图像的产品中。"生成艺术的水印技术并不新鲜。法国初创公司Imatag提供了一种水印工具，声称不会受到调整大小、裁剪、编辑或压缩图像的影响。另一家公司Steg.AI则采用人工智能模型来应用水印，这种水印可以经受大小调整和其他编辑。微软和Google已经采用了基于人工智能的水印标准和技术，而在其他地方，Shutterstock和Midjourney也已经同意了嵌入标记的指导方针，表明其内容是由人工智能生成工具创建的。但是，科技公司面临的压力越来越大，它们必须更清楚地说明作品是由人工智能生成的--特别是考虑到加沙战争中大量的Deepfakes和绕过过滤器的人工智能生成的虐童图片。最近，中国国家互联网信息办公室发布规定，要求人工智能生成器厂商在不影响用户使用的情况下，对生成的内容（包括文本和图片生成器）进行标注。在最近的美国参议院委员会听证会上，参议员KyrstenSinema强调了生成式人工智能透明度的必要性，包括使用水印。...PC版：https://www.cnbeta.com.tw/articles/soft/1402571.htm手机版：https://m.cnbeta.com.tw/view/1402571.htm

Meta的新AI助手将根据Facebook和Instagram上的公开帖子进行训练

Meta的新AI助手将根据Facebook和Instagram上的公开帖子进行训练Meta公司全球事务总裁尼克-克莱格（NickClegg）在本周举行的公司年度连接会议（Connectconference）间隙表示，Meta公司也没有将其消息服务上的私人聊天作为模型的训练数据，并采取措施从用于训练的公共数据集中过滤私人细节。克莱格说："我们已经尝试排除那些个人信息占绝大多数的数据集，"他补充说，Meta用于培训的"绝大多数"数据都是公开的。他以LinkedIn为例指出，出于隐私考虑，Meta有意不使用该网站的内容。在克莱格发表上述评论之际，包括Meta、OpenAI和Alphabet旗下Google在内的科技公司因未经许可使用从互联网上采集的信息来训练它们的人工智能模型而饱受批评。这两家公司正在权衡如何处理在这一过程中他们的人工智能系统可能复制的私人或受版权保护的资料，同时还要面对作者指控他们侵犯版权的诉讼。首席执行官马克-扎克伯格（MarkZuckerberg）周三在Meta公司的年度产品会议"Connect"上发布了公司首批面向消费者的人工智能工具，MetaAI是其中最重要的产品。今年的会议主要讨论人工智能，而不像以往的会议主要关注增强现实和虚拟现实。Meta表示，该助手使用了一个基于强大的Llama2大型语言模型的定制模型，该模型已于今年7月公开用于商业用途，同时还使用了一个名为Emu的新模型，该模型可根据文本提示生成图像。该产品将能生成文本、音频和图像，并能通过与微软必应搜索引擎的合作获取实时信息。用于训练MetaAI的Facebook和Instagram公开帖子还包括文字和照片。Meta公司的一位发言人告诉路透社，这些帖子被用来训练Emu的图像生成功能，而聊天功能则是在Llama2的基础上添加了一些公开可用的注释数据集。该发言人说，与MetaAI的互动也可能被用来改进未来的功能。Meta对MetaAI工具可以生成的内容施加了安全限制，比如禁止创建公众人物的逼真图像。关于受版权保护的材料，克莱格说，他预计会有"相当数量的诉讼"，涉及"创意内容是否在现有的合理使用原则范围内"，该原则允许出于评论、研究和戏仿等目的有限度地使用受保护的作品。一些拥有图像生成工具的公司为复制米老鼠等标志性人物提供了便利，而另一些公司则为这些素材支付了费用，或有意避免将其纳入训练数据。例如，OpenAI今年夏天与内容提供商Shutterstock签订了一份为期六年的协议，使用该公司的图片、视频和音乐库进行训练。当被问及Meta是否采取了任何此类措施来避免复制受版权保护的图片时，Meta的一位发言人指出，新的服务条款禁止用户生成侵犯隐私权和知识产权的内容。...PC版：https://www.cnbeta.com.tw/articles/soft/1387449.htm手机版：https://m.cnbeta.com.tw/view/1387449.htm

Meta 推出独立的人工智能图像生成器，目前免费但只支持英文提示词

Meta推出独立的人工智能图像生成器，目前免费但只支持英文提示词Meta在网页上推出了一种新的、独立的生成式人工智能体验「」，它允许用户通过用自然语言描述图像来创建图像。新的人工图像生成器由Meta现有的Emu图像生成模型提供支持，可根据文本提示创建高分辨率图像。它目前对美国的英语用户免费使用，并且每个提示都会生成四个图像。——

消息称苹果与Meta讨论合作，将生成式AI引入Apple Intelligence

消息称苹果与Meta讨论合作，将生成式AI引入AppleIntelligence据知情人士透露，Facebook的母公司Meta已与苹果公司讨论，将Meta的生成式人工智能模型整合到最近发布的AppleIntelligence中，用于iPhone和其他设备。报道称，除了谷歌和Meta，人工智能初创公司Anthropic和Perplexity也一直在与苹果商谈，希望把它们的生成式人工智能引入苹果智能系统。关注频道@ZaiHuaPd频道爆料@ZaiHuabot

【OpenAI推出AI系统，将文本转换为逼真的视频】

【OpenAI推出AI系统，将文本转换为逼真的视频】OpenAI公布了一种新的人工智能系统，该系统可以根据用户的文本提示创建逼真的视频，使其成为最新一家采用生成视频技术的人工智能公司。该公司周四在一篇博客文章中表示，这款名为Sora的人工智能系统可以快速制作长达一分钟的视频，这些视频可以呈现“具有多个角色、特定类型的动作、以及主题和背景的准确细节的复杂场景”。OpenAI首席执行官SamAltman表示，该工具最初将提供给“有限数量的创作者”。

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人