一个猜测,Open AI在Tiktok发布的这些Sora视频的配音和配乐是不是也是某个模型自动匹配和生成的?

一个猜测,Open AI在Tiktok发布的这些Sora视频的配音和配乐是不是也是某个模型自动匹配和生成的? 提示:“一位 F1 车手白天在旧金山的街道上比赛,头盔摄像头捕捉到了车手的视角。远处可以看到金门大桥和城市景观,蓝天和阳光照亮了场景。驾驶员熟练地操纵汽车,在弯道上超越了汽车。”

相关推荐

封面图片

卧槽,Open AI的大招终于来了,发布视频生成模型 Sora,从演示来看生成时长、运动幅度以及稳定性均碾压现在的所有生

卧槽,Open AI的大招终于来了,发布视频生成模型 Sora,从演示来看视频生成时长、运动幅度以及稳定性均碾压现在的所有视频生成模型。 Sora能够创作出长达一分钟的视频,不仅保证了视频的视觉质量,还能准确响应用户的指令。将在今天想有限的访问者开放。 模型优势: Sora能够创造出包括多个角色、特定动作类型以及对主题和背景的精确细节描述的复杂场景。这款模型不仅能理解用户在指令中提出的需求,还能洞察这些元素在现实世界中是如何存在和表现的。 这款模型对语言的理解非常深刻,使其能够精准地识别用户的指令,并创造出表情丰富、情感生动的角色。此外,Sora还能在同一视频内制作多个镜头,同时确保角色的形象和整体的视觉风格保持一致。 工作原理: Sora是一种扩散模型(diffusion model),它通过从类似静态噪声的视频出发,逐步去除噪声,从而在多个步骤中生成视频。 Sora不仅能一次生成整个视频,还能延长已有视频的长度。我们通过使模型能够预见多个画面帧,解决了确保视频中主题即使暂时离开画面也能保持一致的难题。 Sora采用了类似于GPT模型的变压器架构(transformer architecture),这为其带来了优异的扩展性能。 在Sora中,视频和图像被表示为一系列小块数据,称为“补丁”(patches),每个补丁都类似于GPT中的“令牌”(token)。通过统一数据表示方式,我们能够在之前不可能的更广泛视觉数据范围内训练扩散变压器,包括不同的时长、分辨率和长宽比。 Sora基于DALL·E和GPT模型的研究成果。它采用了DALL·E 3中的重标记技术(recaptioning technique),为视觉训练数据生成详细描述的标题。因此,模型能更准确地遵循用户在生成视频中的文字指令。 除了能从文字指令生成视频外,Sora还能将现有静止图像转化为视频,准确地动态展现图像内容并关注细节。此外,它还能扩展现有视频或填补视频中缺失的画面。 了解更多:

封面图片

如何看待国产sora可灵图生视频和续写功能上线,最长可生成3分钟?大模型到达什么水平了?

如何看待国产sora可灵图生视频和视频续写功能上线,最长可生成3分钟视频?国产大模型到达什么水平了? 深海逐豚的回答 去年chatgpt爆火的时候就说过,这条路实际上有利于中国。道理很简单,算法都现成的,核心点变成了数据、调参、训练。事实上就是这个行业初步的量产化了。 中国在开发算法上跟美国还有比较大的差距,但是在扩大规模、迅速量产方面,绝对是世界第一梯队的。中国还有一个美国没有的优势,就是AI能够快速跟产业对接。我本人都已经跟不少企业主聊过了,虽然现在大模型很难接入工业制造领域,但是他们其实也一直在关注。 所以美国的限制越来越丧心病狂,连4090都给禁了。新的路线里最重要的是数据和算力,既然数据阻挡不了,那就限制你的算力。 但是实际上这也就是稍微拖慢一下进程,因为严格的禁令反而让国产AI计算卡进展迅速,供不应求,迭代速度飞快。我问过好几家国内大厂的人,都反馈国产显卡用着还可以。当然肯定不如cuda那么好用,但是还可以,就不会掉队。 via 知乎热榜 (author: 深海逐豚)

封面图片

许多研究人员说,目前生成式AI模型发展趋势有可能强化美国和中国在AI赛道上的主导地位,令非洲处于落后地位,非洲可能还不得不应对A

许多研究人员说,目前生成式AI模型发展趋势有可能强化美国和中国在AI赛道上的主导地位,令非洲处于落后地位,非洲可能还不得不应对AI造成的问题。他们说,这种后果包括在非洲国家选举中面临更多的虚假信息,以及非洲国家的语言在数字技术中消失。

封面图片

报道称特斯拉训练自动驾驶特殊照顾马斯克和网红 体验未必那么好

报道称特斯拉训练自动驾驶特殊照顾马斯克和网红 体验未必那么好 据悉,这些数据标注员主要关注两种类型的司机:特斯拉CEO埃隆·马斯克(Elon Musk)和一小群精选的“VIP”司机。媒体采访了十几名现任和前任特斯拉员工,他们几乎都选择匿名发言,表示马斯克的特斯拉车辆的图像和视频片段受到了极其细致的审查,而来自YouTube博主等知名网红司机的数据则享受“VIP”级待遇,会优先识别并解决完全自动驾驶(FSD)软件的问题。因此,特斯拉的Autopilot和FSD软件可能更擅长马斯克和其他知名司机的路线,使他们的行驶更加顺畅。专家指出,这种资源分配的不均可能分散公司实现真正自动驾驶的核心使命。每辆特斯拉都配备了九个摄像头,车主可以选择分享这些摄像头的视频以帮助改进特斯拉的自动驾驶系统。特斯拉的数据标注员会审查与特斯拉共享的视频片段,并利用这些图像训练系统如何正确执行转向或识别停车标志。员工还会审查系统未能正确响应的情况,以及驾驶员不得不重新接管车辆的情况。数据标注员会标注系统工作正常的视频和出现问题的实例。通过识别问题,数据标注团队能够使用新信息更新特斯拉的全球数据库,消除其他特斯拉在遇到相同情况时的困惑。简而言之,他们会告诉特斯拉的人工智能,要在有四向停车标志的交叉路口先停再走。多名员工表示,自项目开始以来,分析马斯克车辆的数据就是优先事项。有八名员工表示,自己肯定记得自己标注过与马斯克有关的数据。其中两人说,他们在2021年标注了一条进出加州希尔斯伯勒的一座豪宅的行驶路线,后来他们得知这座豪宅属于马斯克。马斯克于2021年11月以3,200万美元售出了该房产。几名员工还表示,他们花了很多时间标注进出位于加州奥斯汀和弗里蒙特的特斯拉工厂以及位于霍桑的SpaceX办公室的路线。虽然数据标注员可能查看了其他特斯拉员工或驾驶特斯拉汽车的SpaceX员工的数据,但他们表示,对加州或其他地方的其他工厂或办公室的停车场并未给予同样的关注。此外,有一位员工回忆起自己在2022年末至2023年初标记了一系列与推特总部相关的视频。这名员工说,团队被告知在马斯克接管这家社交媒体公司期间关注推特总部附近的数据。前Autopilot分析师兼试驾员约翰·伯纳尔(John Bernal)以及其他三名前员工透露,他们被告知自己正在处理马斯克汽车的数据,并且特别要小心处理这些视频片段,不仅要花费更多时间,并且这些片段还会经过一轮额外的质量保证。“很明显,马斯克的体验肯定比任何其他人都要好,”一名前员工表示。“他体验到的是软件的最佳状态。”还有员工对这种做法表示疑虑。“感觉我们似乎是故意让他的车变得更好,使得自动驾驶看起来与实际不同,”另一名前员工说。“这种做法感觉不诚实。”另外四名员工表示,他们认为自己标注的路线与马斯克有关,但并未被上级明确告知。当标注员查看数据时,他们可以看到视频的时间戳和地理位置,但无法查看明确识别特定车辆或驾驶员的信息。标注员表示,他们可以依靠车辆行驶的路线和地点等环境线索来推测车主身份。一些员工表示,如果未能正确标注马斯克的数据,后果可能相当严重。两名前员工回忆说,在标注他们认为来源于马斯克汽车的视频片段后不久,一名数据标注员就被解雇了。员工们说,因为这名员工未能正确标注高速公路出口标识,随即就被护送出了位于纽约州布法罗的特斯拉工厂。一名前员工说,在数据标注领域,没有事先警告就解雇员工是非常不寻常的,如果员工未能达到业绩指标,他们通常会被提前通知。一名前员工回忆说,他们在2020年标注了一条从洛杉矶某住宅到SpaceX霍桑总部的路线,那时自动驾驶软件难以识别通往匝道的道路标线。特斯拉的自动驾驶软件过去一直难以追踪不完整的车道标线。在沃尔特·艾萨克森(Walter Isaacson)所著的马斯克传记中,作者提到在Autopilot项目的早期,特斯拉曾说服加州交通部的一位“马斯克粉丝”重新粉刷405号州际公路的车道标线,因为马斯克遇到了由于车道标线褪色导致的自动驾驶问题。然而,一名前员工表示,没有任何标注人员能确切知道某个视频片段是否属于某位司机,他们补充说,任何人认为自己知道车主信息都是“纯属猜测”。特斯拉和马斯克的代表未对记者的置评请求作出回应。特斯拉网红也得到特别关注马斯克并不是唯一一个享有特殊待遇的司机。自FSD于2020年发布以来,特斯拉粉丝和批评者在社交媒体上分享各种软件成功和失败的视频,其中包括特斯拉汽车在无人干预的情况下顺利驾驶复杂路线,以及显示汽车错误地碾过儿童大小假人或将月亮误认为是交通信号灯的视频。特斯拉员工密切关注这些视频。实际上,公司设立了一个系统,优先处理那些最有可能在线分享驾驶体验的司机的数据。根据员工的说法,这些司机在公司内部被称为“VIP”用户,他们的数据有时会优先处理。从YouTube等平台的VIP用户那里收集到的数据会受到更严格的审查,并且更有可能被标注。三名现任和前任员工透露,他们的团队领导明确告诉他们,他们正在处理“VIP数据”,并且如果能在FSD更新前完成工作,他们可以获得加班费。“我们会注重标注这些车辆常驶过的每一个区域。”一名前员工说,他的经理告诉他,他们正在处理的是“特斯拉影响力者”的数据,“我们会找到他们居住的地方,并标注从那里开始的整个路线。”伯纳尔说,特斯拉还派了多名试驾员前往YouTube知名博主开车经过的道路。比如罗杰·巴尔瓦尼(Raj Balwani)和切克·库克(Chuck Cook)这两位用户,他们经常在Youtube上对特斯拉软件进行评测。伯纳尔说,在巴尔瓦尼发布了一段特斯拉FSD系统反复尝试驶出一条知名弯道的视频后,包括他自己在内的八九名试驾员专门跑到伦巴第街寻找解决方案。据伯纳尔说,特斯拉最终在系统中编程加入看不见的障碍物,为伦巴第街解决了这个拐弯问题。伯纳尔于2022年被特斯拉解雇。他说,主要是因为他在自己的YouTube频道上分享了不少自家特斯拉在使用FSD时出现问题的视频。巴尔瓦尼表示,他从未被任何特斯拉员工就其视频内容联系过,但他认为公司关注在线反馈是一个积极的迹象。巴尔瓦尼说:“这只是表明他们的团队正在监控并参与他们需要关注的领域。”他还说:“自从我开始使用FSD以来,我记录和经历的大部分问题几乎都已解决,这实在是令人难以置信。”2022年,马斯克在推特上祝贺库克向特斯拉提出了一个难题。在此之前,特斯拉推出了一次更新,旨在解决库克在其视频中指出的汽车贸然左转的问题。库克表示,他非常清楚特斯拉对他视频内容的关注。事实上,他说,他每周都能在自己的社区看到特斯拉的试驾员。这位YouTube博主表示,他曾尝试通过电子邮件和社交媒体联系Autopilot工程师,但他们从未回复,他所在社区的试驾员对他们的工作也非常保密。库克表示,他在2020年曾向FSD试驾员的电子邮箱发送了一封邮件,询问特斯拉是否真的在关注他的数据。他说:“他们立即发送了一张30分钟前我车内摄像头拍摄的画面截图。”库克认为,特斯拉并不是特意关注网红,而是在收集最佳数据以训练其系统。库克说:“他们知道我不是在夸大其词、盲目崇拜或过分批评。我很公正。”一位知情人士表示,VIP系统并不是为了提供优待,而是特斯拉改进FSD体验的另一种方式。这名员工说:“这些YouTube博主不断试图突... PC版: 手机版:

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人