人工智能初创公司 Runway 发布文本到视频模型 Gen-2

人工智能初创公司 Runway 发布文本到视频模型 Gen-2 Gen-2 支持从文本到视频、图像到视频、文本+图像到视频各种场景,可以从几句用户提示中生成简短的视频片段。用户可通过 Runway 的加入 Gen-2 候补名单。 Runway 同时协助开发了开源图像生成模型 Stable Diffusion,比起拥有巨大资源的科技巨头,Runway 只是一个45人团队的人工智能初创公司,这也反映着初创公司在生成式AI上的潜力有多么惊人。

相关推荐

封面图片

OpenAI 推出文本到视频人工智能模型 Sora

OpenAI 推出文本到视频人工智能模型 Sora 根据 OpenAI 的介绍博文,Sora 能够创建"具有多个角色、特定运动类型以及主体和背景准确细节的复杂场景"。该公司还指出,该模型能够理解物体"在物理世界中的存在方式",还能"准确解释道具并生成表达生动情感的引人注目的角色"。该模型还能根据静态图像生成视频,以及在现有视频中填充缺失的帧或扩展视频。OpenAI 的博文中包含的 Sora 生成的演示包括淘金热时期加利福尼亚州的空中场景、从东京火车内部拍摄的视频等。许多演示都有人工智能的痕迹比如在一段博物馆的视频中,地板疑似在移动。OpenAI 表示,该模型"可能难以准确模拟复杂场景的物理现象",但总体而言,演示结果令人印象深刻。几年前,像 Midjourney 这样的文本到图像生成器在模型将文字转化为图像的能力方面处于领先地位。但最近,视频技术开始飞速进步:Runway 和 Pika 等公司都展示了自己令人印象深刻的文字转视频模型,而Google的 Lumiere 也将成为 OpenAI 在这一领域的主要竞争对手之一。与 Sora 类似,Lumiere 也为用户提供了文字转换视频的工具,还能让用户通过静态图像创建视频。Sora 目前只对"红队"人员开放,他们负责评估模型的潜在危害和风险。OpenAI 还向一些视觉艺术家、设计师和电影制片人提供访问权限,以获得反馈意见。它指出,现有模型可能无法准确模拟复杂场景的物理现象,也可能无法正确解释某些因果关系。本月早些时候,OpenAI 宣布将在其文本到图像工具 DALL-E 3 中添加水印,但指出这些水印"很容易去除"。与其他人工智能产品一样,OpenAI 将不得不面对人工智能逼真视频被误认为是真实视频的后果。 ... PC版: 手机版:

封面图片

Stable Diffusion 是人工智能公司 Stability AI 背后的文本到图像模型,于 2022 年 8 月发布。

Stable Diffusion 是人工智能公司 Stability AI 背后的文本到图像模型,于 2022 年 8 月发布。Stability AI 首席执行官 Emad Mostaque 表示,Stable Diffusion 在所有渠道拥有超过 1000 万用户。如果我们推断一下《Midjourney》的数据和趋势,就会发现,通过官方的 Stable Diffusion 渠道,用户每天会生成 200 万张图片,而在发布一年多的时间里,这个数字已经达到了 6.9 亿张图像。 如果加上其他流行模型(例如 Runway,我们单独统计)和 Stability AI 的官方渠道,使用 Stable Diffusion 创建的图像数量将增加到 125.9 亿张,占所有使用文本转文字创建的 AI 图像的 80%。 Adobe Firefly Adobe Adobe 推出了 Firefly,于 2023 年 3 月发布。上线 6 周内,用户创建了超过 1 亿资产。随着 Firefly 于 2023 年 5 月集成到 Adobe Photoshop,考虑到全球使用 Photoshop 的人数,图像数量呈指数级增长。 Adobe 在最新的新闻稿中分享了其 AI 图像统计数据:推出仅 3 个月,使用 Adobe Firefly 创建的图像数量就已达到 10 亿张。 使用 Stable Diffusion、Adobe Firefly、Midjourney 和 DALLE-2 总共生成了超过 150 亿张人工智能创建的图像。这比 Shutterstock 的整个照片、矢量图和插图库还要多,而且是 Instagram 上传的图片数量的三分之一。

封面图片

网站Gen-2 Runway

网站Gen-2 Runway 网站功能:AI视频生成 网站简介:Gen-2是一个多模态AI系统,可以根据文本、图像或视频片段生成新的视频。它可以逼真且一致地合成新的视频,无论是将图像或文本提示的构图和风格应用到源视频的结构上(视频到视频),还是仅使用文字(文本到视频)。 网站网址:点击打开

封面图片

人工智能初创公司Anthropic推出聊天机器人Claude 3新模型

人工智能初创公司Anthropic推出聊天机器人Claude 3新模型 该公司称,在行业基准测试中,能力最强的新机型 Claude 3 Opus 的表现优于 OpenAI 的 GPT-4 和Google的 Gemini Ultra,如本科生水平的知识、研究生水平的推理和基础数学。这是 Anthropic 首次提供多模式支持。用户可以上传照片、图表、文档和其他类型的非结构化数据,以供分析和解答。其他定制改款模型如 Sonnet 和 Haiku比 Opus 更小巧,价格也更低。据 Anthropic 称,Sonnet 和 Opus 从下周一开始在 159 个国家上线,而 Haiku 将很快上线。该公司拒绝说明培训 Claude 3 所花费的时间或成本,但表示 Airtable 和 Asana 等公司帮助对这些模型进行了 A/B 测试。去年这个时候,Anthropic 开始被认为是一家很有前途的生成式人工智能初创公司,它由前 OpenAI 研究高管创立。它已经完成了 A 轮和 B 轮融资,但只推出了第一版聊天机器人,没有任何消费者访问或大张旗鼓的宣传。12 个月后,它已成为最炙手可热的人工智能初创公司之一,支持者包括Google、Salesforce 和亚马逊,其产品在企业和消费者领域都与 ChatGPT 直接竞争。在过去的一年里,这家初创公司完成了五笔不同的融资交易,总金额约为 73 亿美元。根据 PitchBook 的数据,在过去一年里,生成式人工智能领域出现了爆炸式增长,2023 年近 700 笔交易的投资额达到了创纪录的 291 亿美元,交易额同比增长超过 260%。它已成为一个又一个季度的企业财报电话会议上最热门的词汇。学术界和伦理学家对该技术传播偏见的倾向表示了极大的担忧,但即便如此,它还是迅速进入了学校、在线旅游、医疗行业、在线广告等领域。Anthropic公司联合创始人丹妮拉-阿莫迪(Daniela Amodei)在接受CNBC采访时说,有60到80人从事核心人工智能模型的开发工作,120到150人从事技术方面的工作。阿莫迪今年 7 月告诉 CNBC,在人工智能模型的最后一次迭代中,有一个 30 到 35 人的团队直接参与其中,共有约 150 人提供支持。Anthropic说,Claude 3可以概括大约15000个单词,或者说是一本相当厚的书(大约是《白鲸记》或《哈利-波特与死亡圣器》的长度范围)。它的前一版本只能概括 75000 字。用户可以输入大型数据集,以备忘录、信件或故事的形式要求摘要,相比之下,ChatGPT 只能处理大约 3000 个单词。阿莫代还表示,与前一版本相比,《Claude 3 号》在应对风险方面有了更好的理解。为了追求一个高度无害的模型,Claude 2有时会过度拒绝请求,当有人碰到一些比较尖锐的话题或碰触信任和安全防护栏时,Claude 2 号在回答这些问题时有时会趋于保守。而根据 Anthropic 的说法,Claude 3 对提示的理解更加细致入微。多模态,即在生成式人工智能中添加照片和视频功能等选项,无论是自己上传还是使用人工智能模型创建,都已迅速成为业界最热门的用例之一。"世界是多模态的,"OpenAI 首席运营官 Brad Lightcap介绍说。"如果你想想我们人类处理世界和与世界打交道的方式,我们看到的东西、听到的东西、说出来的东西世界比文本大得多。因此,对我们来说,将文本和代码作为单一的模式、单一的界面,让我们了解这些模型有多么强大以及它们能做什么,总是感觉不完整。"但是,多模态和日益复杂的人工智能模型也带来了更多潜在风险。最近,Google下线了其人工智能图像生成器(双子座聊天机器人的一部分),因为用户发现了与历史不符的内容和有问题的回复,这些内容在社交媒体上广为流传。Anthropic 的 Claude 3 不生成图像,而只允许用户上传图像和其他文件进行分析。"当然,没有一种模型是完美无缺的,我认为这一点非常重要,"阿莫迪表示。"我们一直非常努力地使这些模型尽可能地兼具能力和安全性。当然,在某些地方,模型还是会不时地出现一些问题。" ... PC版: 手机版:

封面图片

人工智能对人工智能生成的内容进行训练将导致人工智能崩溃

人工智能对人工智能生成的内容进行训练将导致人工智能崩溃 用于训练大型语言模型的数据最初来自人类来源,如书籍、文章、照片等,这些都是在没有人工智能的帮助下创建的。但随着越来越多的人使用人工智能来制作和发布内容,一个明显的问题出现了:当人工智能生成的内容在互联网上扩散时,人工智能模型开始对其进行训练。研究人员发现,“在训练中使用模型生成的内容会导致所产生的模型出现不可逆转的缺陷。”他们研究了文本到文本和图像到图像的人工智能生成模型的概率分布,得出结论:“从其他模型产生的数据中学习会导致模型崩溃 这是一个退化的过程,并且随着时间的推移,模型会忘记真正的基础数据分布。”他们观察到模型崩溃发生得如此之快:模型可以迅速忘记它们最初学习的大部分原始数据。这导致它们随着时间的推移,表现越来越差,错误越来越多。来源 , 来自:雷锋 频道:@kejiqu 群组:@kejiquchat 投稿:@kejiqubot

封面图片

唱片公司起诉两家初创公司利用其歌曲训练人工智能模型

唱片公司起诉两家初创公司利用其歌曲训练人工智能模型 全球最大的唱片公司正在起诉两家人工智能初创公司,采取积极立场保护其知识产权。美国唱片业协会6月24日代表环球音乐集团、华纳音乐集团和索尼音乐娱乐对 Suno AI 和 Udio AI 开发商 Uncharted Labs Inc. 提起了双重诉讼。投诉指控这些公司非法利用大量受版权保护的录音来训练他们的人工智能模型。作为唱片公司行业组织的美国唱片业协会 (RIAA) 正在寻求“每件侵权作品”高达15万美元的赔偿。这可能总计高达数十亿美元。

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人