#OpenAI的语音克隆#人工智能模型只需要15秒的样本即可工作https://www.bannedbook.org/bnews

OpenAI 的语音克隆人工智能模型只需要15秒的样本即可工作

OpenAI的语音克隆人工智能模型只需要15秒的样本即可工作人工智能公司OpenAI正在提供对其开发的文本转语音生成平台VoiceEngine的有限访问权限，该平台可以根据某人15秒的声音片段创建合成声音。人工智能生成的语音可以根据命令以与说话者相同的语言或其他多种语言读出文本提示。OpenAI在其博客文章中表示：“这些小规模部署有助于我们了解方法、保障措施，并思考如何在各个行业中很好地利用VoiceEngine。”拥有访问权限的公司包括教育科技公司AgeofLearning、视觉叙事平台HeyGen、一线健康软件制造商Dimagi、人工智能通信应用创建者Livox和健康系统Lifespan。——、

阿联酋发布“猎鹰”人工智能模型挑战 Meta、OpenAI

阿联酋发布“猎鹰”人工智能模型挑战Meta、OpenAIFalcon是一个大型语言模型，类似于OpenAI的GPT和Google的双子座（Gemini）--为聊天机器人、图像生成器和其他生成式人工智能工具提供动力的计算系统。Falcon于2023年首次推出，它是开源的，这意味着它的代码可以广泛共享。据猎鹰背后的阿布扎比集团技术创新研究所（TII）称，猎鹰的新版本猎鹰211B比MetaPlatforms公司最新推出的同类开源模型更强大，在某些指标上与双子座不相上下。先进技术研究委员会（TII的出资政府实体）秘书长费萨尔-班奈（FaisalAlBannai）在接受采访时说："我们能够实现比许多大公司更高的性能。而我们的计算能力和团队规模只是他们的一小部分。"阿拉伯联合酋长国正在自上而下齐心协力地推动人工智能的发展，将这项技术视为继石油之后的下一个经济支柱。这个海湾国家推出了一系列新业务和一个可能达到1000亿美元的人工智能投资工具。虽然阿联酋和沙特阿拉伯已经宣布了雄心勃勃的人工智能投资计划，但这两个海湾国家不得不引进大量的工程专业知识，并且刚刚开始将生成式人工智能工具应用到企业中。去年秋天，TII称其第一版Falcon的下载量超过1200万次。Meta公司表示，其最新的Llama模型获得了1.7亿次下载。去年11月，先进技术研究委员会（AdvancedTechnologyResearchCouncil）宣布成立AI71公司，这是一家致力于将Falcon商业化的新公司。AlBannai说，AI71已经开始与阿联酋的合作伙伴一起在医院、律师事务所和呼叫中心试用这项技术，并计划很快扩展到国外。他拒绝透露政府为开发Falcon投入了多少资金，但他说，一个由大约60名研究人员组成的团队正在为TII开发几项人工智能服务。据TII称，新版Falcon支持五种欧洲语言和"视觉转语言功能"--一种能让计算机将图像流畅地转换成文本的工具。据AlBannai称，这种能力是阿布扎比为Falcon设计的某些商业应用的关键。他说："分析某人胸部的X光片、分析教育文件、分析建筑文件--我们正试图将重点放在能够产生重大影响的非常明确的企业用例上。"这位官员说，今后，人工智能系统的开发将由一个新组织负责，名为猎鹰基金会（FalconFoundation），以非营利性软件机构Linux基金会为蓝本。阿尔-班奈说，这将包括一个章程，以确保猎鹰"永远保持开源"。他说，该模型的另一个版本将在未来两个月内发布。本周一早些时候，阿布扎比人工智能公司G42（该公司的支持者之一是微软公司）为其阿拉伯语人工智能聊天机器人Jais发布了一款新应用。...PC版：https://www.cnbeta.com.tw/articles/soft/1430740.htm手机版：https://m.cnbeta.com.tw/view/1430740.htm

TikTok 正开发 AI 语音克隆功能，只需 10 秒即可复制你的音色

AssembleDebug发现TikTok正在开发一项新的AI功能，用户可以在几秒钟内让自己的声音出现在“TikTok语音库”中。TheSpAndroid对最新版本的TikTok 应用解包发现，这一功能目前还在开发中，具体发布时间尚无法确认，而且TikTok可能都没有给这一功能命名。用户只需录制一次创建自己的语音包，后续可以借助文本转语音功能在自己的TikTok 视频中使用。“只需10秒钟，即可将您的声音创建为AI版本！您可以在TikTok视频中使用文本转语音功能。”根据TikTok提示，用户需要阅读一段给定的文字并进行录音，但由于目前测试版中还没有实装，这一界面也没有对应的文本，此时就算按下录制按钮也会导致报错，因此目前基本没用。TikTok还采取了多种措施以确保用户的隐私安全问题。当然，用户可以随时将其创建的 AI语音删除，以防被他人盗用或用于他人的内容创作。标签:#TikTok#AI频道:@GodlyNews1投稿:@GodlyNewsBot

OpenAI 推出文本到视频人工智能模型 Sora

OpenAI推出文本到视频人工智能模型Sora根据OpenAI的介绍博文，Sora能够创建"具有多个角色、特定运动类型以及主体和背景准确细节的复杂场景"。该公司还指出，该模型能够理解物体"在物理世界中的存在方式"，还能"准确解释道具并生成表达生动情感的引人注目的角色"。该模型还能根据静态图像生成视频，以及在现有视频中填充缺失的帧或扩展视频。OpenAI的博文中包含的Sora生成的演示包括淘金热时期加利福尼亚州的空中场景、从东京火车内部拍摄的视频等。许多演示都有人工智能的痕迹--比如在一段博物馆的视频中，地板疑似在移动。OpenAI表示，该模型"可能难以准确模拟复杂场景的物理现象"，但总体而言，演示结果令人印象深刻。几年前，像Midjourney这样的文本到图像生成器在模型将文字转化为图像的能力方面处于领先地位。但最近，视频技术开始飞速进步：Runway和Pika等公司都展示了自己令人印象深刻的文字转视频模型，而Google的Lumiere也将成为OpenAI在这一领域的主要竞争对手之一。与Sora类似，Lumiere也为用户提供了文字转换视频的工具，还能让用户通过静态图像创建视频。Sora目前只对"红队"人员开放，他们负责评估模型的潜在危害和风险。OpenAI还向一些视觉艺术家、设计师和电影制片人提供访问权限，以获得反馈意见。它指出，现有模型可能无法准确模拟复杂场景的物理现象，也可能无法正确解释某些因果关系。本月早些时候，OpenAI宣布将在其文本到图像工具DALL-E3中添加水印，但指出这些水印"很容易去除"。与其他人工智能产品一样，OpenAI将不得不面对人工智能逼真视频被误认为是真实视频的后果。...PC版：https://www.cnbeta.com.tw/articles/soft/1418385.htm手机版：https://m.cnbeta.com.tw/view/1418385.htm

OpenAI发布新款人工智能模型GPT-4o

OpenAI 表示已开始训练新的旗舰人工智能模型

OpenAI表示已开始训练新的旗舰人工智能模型OpenAI周二表示，它已开始训练一种新的旗舰人工智能模型，该模型将取代驱动其流行在线聊天机器人ChatGPT的GPT-4技术。OpenAI在一篇博客文章中表示，希望新模型能够带来“更高水平的能力”，因为该公司致力于打造“通用人工智能”，即能够做任何人类大脑能做的事情的机器。新模型将成为人工智能产品的引擎，包括聊天机器人、类似于苹果Siri的数字助理、搜索引擎和图像生成器。——，

相关推荐