谷歌 Gemini 1.5 Pro 锐评 Sora 生成的视频:视觉上很吸引人,但存诸多不合理之处
近日,谷歌的人工智能模型Gemini1.5对OpenAISora生成的一段视频进行了评价,称其在视觉上很吸引人,但一些不合理之处可以看出其不是真实的视频。双方分别发布了各自的最新技术:谷歌推出Gemini1.5Pro,OpenAI则推出了文本转视频工具Sora。Sora的发布时机引发猜测,有人认为OpenAI是为了转移公众对谷歌Gemini1.5的注意力。谷歌一位高管在X平台上分享了对Sora生成视频的详细分析,Gemini1.5Pro以Sora生成的日本一条既有雪景又有樱花盛开的街道视频为例,指出视频存在明显不合理之处。根据Gemini1.5Pro的分析,大雪纷飞和盛开的樱花同时出现并不符合常理,因为樱花通常在春季开放,不会伴有降雪。而且雪的下落方式非常均匀,这不是现实生活中通常的降雪方式。此外,视频中的人物虽然身处大雪环境,却并未穿着任何冬装,这也显得非常违和。Gemini1.5在分析中总结道:“总而言之,这段视频虽然视觉上很吸引人,但其中的矛盾之处表明它并非现实生活中的场景。”Sora是一款能够生成长达60秒视频的文本转视频工具,可以创建包含细节丰富的场景、复杂摄像机运动以及具有丰富情感的多个人物画面,许多人将其称为视频生成领域的“ChatGPT时刻”。而谷歌的Gemini1.5则拥有惊人的100万词条上下文窗口,远超GPT-4Turbo的12.8万和AnthropicClaude2.1的20万。这意味着它可以一次处理大量信息,包括1小时的视频、11小时的音频以及超过30,000行代码或70万字的代码库。via匿名标签:#Google#OpenAI频道:@GodlyNews1投稿:@GodlyNewsBot