OpenAI CTO深度访谈 剧透GPT-5发布时间

OpenAICTO深度访谈剧透GPT-5发布时间OpenAICTO穆拉提分享OpenAI近况与AI行业动向。穆拉提在达特茅斯学院(图源:达特茅斯学院)在这场访谈中,穆拉提分享了自己从航天行业、汽车行业、VR/AR再到加入OpenAI的丰富职业生涯,并根据自己在行业最前沿的所见所闻,分析了AI治理、AI对教育的影响、AI对工作的影响等问题。她在访谈中透露,明年或后年就会出现博士水平的智能系统,这或许指的就是GPT-5。她更是抛出一个极具争议性的观点,有些创意工作本不该存在,而AI很快便会取代这些职位。这一观点在网上引发轩然大波,认为OpenAI吃了饭就砸锅,并不理解创造力意味着什么。穆拉提认为OpenAI的成就离不开深度神经网络、大量数据和大量算力这3个因素的叠加,虽然他们还在研究背后的原理,但实践证明深度学习真的行得通。她称AI安全和AI能力是一体两面的,聪明的模型才能理解我们给它设定的护栏。从工程的角度上来看,AI能力的提升并不会降低模型的安全性。OpenAI对模型的安全性负有很大责任,但要实现风险的有效管控,社会和政府的参与也是必不可少的。OpenAI正积极与政府和监管机构合作,共同解决AI安全问题。在场的观众也向穆拉提抛出了尖锐的问题。穆拉提在回应观众对于模型价值观的问题时提到,OpenAI目前已经通过人类反馈强化学习将人类价值观融入AI系统,但未来的重点会是在基础价值体系上,给客户提供高度定制化的模型价值体系。观众还就OpenAI最近的侵权疑云和内容创作者的许可和补偿问题询问穆拉提的看法。穆拉提再次强调OpenAI并未刻意模仿斯嘉丽的声音,她挑选声音的决策过程是完全独立的。至于版权内容,OpenAI目前在尝试以聚合数据池的形式,让创作者提供版权内容到数据池中,整体评估创意内容对模型表现的贡献,并给予相应的报酬。但这一技术颇具难度,实际落地还需要一段时间。与OpenAICEO萨姆·阿尔特曼(SamAltman)不同,穆拉提之前的公众认知度较低。她在1998年出生于阿尔巴尼亚,之后到加拿大和美国求学。她2018年便加入OpenAI,是OpenAI的早期成员之一。作为OpenAI的CTO,她领导了OpenAI在ChatGPT、DALL·E、Codex和Sora方面的工作,同时还监管公司的研究、产品和安全团队。微软首席执行官萨蒂亚·纳德拉(SatyaNadella)评价穆拉提时说到,她既具备技术专长,也颇有商业头脑,并对OpenAI的使命有深刻认识。以下是对穆拉提在达特茅斯学院深度访谈的完整编译(为提高可读性,智东西调整了部分问答的顺序,并在不违背原意的前提下进行了一定的增删修改):01.干过航天、汽车、VR/AR等行业,发现自己对AI最感兴趣杰弗里·布莱克本:大家都想听听你的近况和你正在构建的东西,这真是太吸引人了。不过也许我们应该从你的故事开始。你毕业后去了特斯拉一段时间,然后是OpenAI。你能简短地和我们描述一下那个时期吗,还有你加入早期的OpenAI的故事。米拉·穆拉提:我大学毕业之后其实在航空领域短暂工作过,但之后我意识到航空领域的发展相当缓慢。我对特斯拉的使命非常感兴趣,也对构建可持续交通的未来需要面临的创新挑战感兴趣,因此我决定加入特斯拉。在参与ModelS和ModelX的工作后,我意识到自己也不想在汽车行业工作。我想要做一些能真正推动社会发展的事情,同时解决一些非常困难的工程挑战。我在特斯拉的时候对自动驾驶汽车、计算机视觉、AI这些技术和它们在自动驾驶汽车上的应用很感兴趣。我那时候想更深入地了解AI的其它领域。于是我加入了一家初创公司,在那里领导工程和产品团队,将AI和计算机视觉应用于空间计算领域,研究计算的下一个界面。当时我认为计算的交互界面会是VR和AR,但现在我的想法不一样了。那时候我认为,如果我们可以用手与非常复杂的信息交互,无论是公式、分子还是拓扑概念,我们便可以更直观地了解这些东西,扩展自己的学识。然而事实证明,当时谈VR还为时过早。但这给了我许多机会,能了解不同领域的AI技术。我想我的职业生涯一直都处于技术和应用的交叉点。这给了我一个不同的视角,能大致了解AI的发展程度以及它可以应用到什么领域。杰弗里·布莱克本:所以在特斯拉的自动驾驶研究中,你看到了机器学习、深度学习的可能性,看到了它的发展方向。米拉·穆拉提:是的。但我并没有看得很清楚。杰弗里·布莱克本:你给马斯克工作过吗?米拉·穆拉提:是的,特别是在最后一年。但那时我们还不太明确AI的发展方向。当时,我们仍然只是将AI应用于特定的应用场景里,而非通用的场景。VR和AR也是如此。而我不想只是将这些技术应用于具体问题。我想做更多的研究,了解背后的原理,然后开始将这些技术应用到其他事物上。我就在这个阶段加入了OpenAI,OpenAI的使命对我非常有吸引力。当时它是一个非营利组织。现在使命没有变,但结构变了。当我6年前加入时,它是一个致力于构建安全AGI(通用人工智能)的非营利组织。当时OpenAI是DeepMind之外唯一一个做相关研究的公司。这就是我在OpenAI旅程的开始。02.3大技术进步让ChatGPT成为可能,实践证明模型能深入理解数据杰弗里·布莱克本:明白了,所以你从那时起你就一直在构建很多东西。也许你可以为在场的观众提供一些AI的基础知识。从机器学习、深度学习到现在的AI,这些概念都是相互关联的,但也各有不同。这些转变是如何发生的呢,又是如何让ChatGPT、DALL·E或者Sora这样的产品成为可能的呢?米拉·穆拉提:其实我们的产品并不是全新的,在某种意义上我们的产品是建立在过去几十年人类共同的努力的基础上的。其实AI就开始于达特茅斯学院。在过去几十年中,神经网络、大量数据和大量算力的结合带来了真正具有变革性的AI系统或模型,它们能够执行一般性任务。尽管我们不清楚其为何成功,但是深度学习真的行得通。我们也试图通过研究和工具来理解这些系统的实际运作方式。不过根据我们过去几年研究AI技术时的经验,我们知道这条路行得通。我们也见证了它们逐渐进步的轨迹。以GPT-3为例,这是一个大约三年半前部署的大型语言模型。其目标是预测下一个token,基本上是下一个单词的预测。我们发现,如果我们给这个模型预测下一个token的任务,并用大量数据训练这个模型,给它大量计算资源时,我们还能获得一个真正理解语言的模型,而且其理解水平与人类相似。它通过阅读大量书籍和互联网的信息,形成了自己对这些数据的模式的理解,而不仅仅是简单地记忆。我们还发现,这种模型不仅可以处理语言,还可以处理不同类型的数据,如代码、图像、视频和声音。它并不在乎我们输入什么数据。我们发现,数据、计算和深度学习的结合运作得非常好,通过增加数据类型和计算量,这些AI系统的性能会不断提高。这便是所谓的扩展法则(ScalingLaws)。它不是实际的法则,而是模型能力提高的统计学预测。这就是推动今天AI进步的动力。杰弗里·布莱克本:你们为什么选择了聊天机器人作为第一款产品呢?米拉·穆拉提:就产品而言,我们其实是从API开始的,而不是聊天机器人。因为我们不知道如何将GPT-3商业化。商业化AI技术实际上非常困难。我们最初专注于技术的开发和研究,我们认为只要构建了一个优秀的模型,商业伙伴就会自然地拿它去构建产品。但后来我们发现这实际上非常困难,这也是为什么我们开始自己开发产品。于是我们开始自己构建一个聊天机器人,我们试图理解为...PC版:https://www.cnbeta.com.tw/articles/soft/1436153.htm手机版:https://m.cnbeta.com.tw/view/1436153.htm

相关推荐

封面图片

GPT-4发布仅5个月 OpenAI在中国申请注册“GPT-5”商标

GPT-4发布仅5个月OpenAI在中国申请注册“GPT-5”商标据上证报,7月31日,美国商标律师JoshGerben在社交平台发文称,OpenAI已于7月18日向美国专利商标局(USPTO)提交“GPT-5”商标申请。商标申请信息显示,GPT-5提供离线/在线版本“人工生成语音和文本的计算机软件”;以及离线/在线版本“自然语言处理、生成、理解和分析的计算机软件”。据悉,在这次披露的申请书中,OpenAI提到,尚未发布的GPT-5将具备众多GPT-4所没有的能力,而且几乎每一项都剑指AGI。今年3月14日,OpenAI发布GPT-4。而就在上个月,OpenAI向付费用户全面开放了GPT-4API。GPT-4API,全面开放使用!7月7日,OpenAI在官网宣布,GPT-4API全面开放使用。现所有付费API用户都可直接访问8K上下文的GPT-4,无需任何等待。图片来源:OpenAI官网OpenAI表示,GPT-4是我们能力最强的型号。自3月份以来,数百万开发人员请求访问GPT-4API,利用GPT-4的创新产品的范围每天都在增长。如今,全球开发者都能使用GPT-4大语言模型,增强自己的应用程序或开发全新的生成式AI应用。我们计划在本月底前向新的开发人员开放,然后根据计算可用性开始提高费率限制。现在,已经正式全面开放,全球开发者都能使用GPT-4大语言模型,增强自己的应用程序或开发全新的生成式AI应用。图片来源:OpenAI官网OpenAI表示,我们在三月份推出了聊天补全API,它现在占我们APIGPT使用量的97%。最初的CompletionsAPI于2020年6月推出,为与我们的语言模型交互提供了自由文本提示。从那以后,我们了解到,使用更结构化的提示界面通常可以提供更好的结果。事实证明,基于聊天的范式非常强大,可以处理绝大多数以前的用例和新的会话需求,同时提供更高的灵活性和特异性。特别是,聊天完成API的结构化界面(例如,系统消息、函数调用)和多回合对话功能使开发人员能够构建对话体验和广泛的完成任务。它还有助于降低即时注入攻击的风险,因为用户提供的内容可以在结构上与指令分离。OpenAI称,基于这些模型的稳定性和生产规模使用的准备程度,我们还推出了GPT-3.5Turbo、DALL·E和WhisperAPI。我们正在为GPT-4和GPT-3.5Turbo安全地启用微调,预计该功能将于今年晚些时候推出。此外,OpenAI还宣布了一些弃用模型和全新的版本。例如,davinci-instruct-beta、gpt-curie-instruct-beta、text-ada-001、text-babbage-001、text-curie-001、text-davinci-001、text-davinci-002和text-davinci-003由gpt-3.5-turbo-instruct替代。ChatGPT近期热度持续回落自2022年11月以来持续火爆的ChatGPT热度在近段时间出现了明显下滑。据SimilarWeb的数据,2023年前五个月ChatGPT全球访问量环比增幅分别为131.6%、62.5%、55.8%、12.6%、2.8%,而6月份数据为环比下降9.7%,首次出现负增长。根据SimilarWeb的数据显示,ChatGPT自2022年11月在美国推出,仅在短短2个月内活跃用户规模便突破1亿大关。年初的流量爆发主要由ToC端的用户所推动,ChatGPT远超前代的用户体验给予了用户极大的新鲜感,并通过TikTok等社交媒体迅速传播。根据Google热度指数,从2022年10月至2023年4月“AI”关键词的热度增长了267%。但紧接着从5月开始,“AI”关键词的热度增长趋于停滞,并在5月14日至5月21日这一周内出现了近一年来的最大幅度下滑。据第一财经,中信证券分析认为,ChatGPT用户流量下滑主要源于个人用户新鲜感降低,以及OpenAI主动调整运营策略(算力资源成本约束)、将重心转向2B领域等,最为直观的证据便是:目前ChatGPT相关插件、开发工具链继续保持较高热度,同时大部分欧美软件企业产品开始全面融入生成式AI。长期维度,大语言模型在提高生产效率方面具有天然优势,企业市场相对细分的应用场景,叠加企业各自独有的场景&业务数据等,料将使得大语言模型在2B领域发展进程和市场空间,显著优于2C市场,而微软提出的Copilot将是最为可行的落地方式。持续看好全球AI产业的发展进程,并建议在下半年重点关注美股软件企业在AI领域的进展及相应投资机会。...PC版:https://www.cnbeta.com.tw/articles/soft/1376203.htm手机版:https://m.cnbeta.com.tw/view/1376203.htm

封面图片

OpenAI发布最新旗舰生成式AI模型GPT-4o 改进文本、视觉和音频功能

OpenAI发布最新旗舰生成式AI模型GPT-4o改进文本、视觉和音频功能穆拉提在OpenAI办公室举行的主题演讲上说:GPT-4o的理由横跨语音、文本和视觉。OpenAI将发布桌面版ChatGPT和全新的用户界面。穆拉提说:"我们知道这些模型越来越复杂,但我们希望交互体验变得更自然、更简单,让你完全不用关注用户界面,而只关注与GPT的协作。这一点非常重要,因为我们正在展望人类与机器之间互动的未来。"GPT-4是OpenAI之前的领先模型,它是图像和文本的结合体,可以分析图像和文本,完成从图像中提取文本甚至描述图像内容等任务。但GPT-4o增加了语音功能。这具体能带来什么?很多方面。GPT-4o极大地改善了ChatGPT的体验--ChatGPT是OpenAI的病毒式人工智能聊天机器人。ChatGPT长期以来一直提供语音模式,使用文本到语音模式转录ChatGPT中的文本。但GPT-4o对此进行了改进,让用户可以更像使用助手一样与ChatGPT互动。例如,用户可以向由GPT-4o支持的ChatGPT提问,并在ChatGPT回答时打断它。OpenAI表示,该模型能提供"实时"响应,甚至能捕捉用户声音中的情感,并生成"一系列不同情感风格"的语音。GPT-4o还改进了ChatGPT的视觉功能。有了照片或桌面屏幕,ChatGPT现在可以快速回答相关问题,从"这个软件代码是怎么回事"到"这个人穿的是什么牌子的衬衫?其他方面,OpenAI将发布桌面版ChatGPT和全新的用户界面。穆拉提说:"我们知道这些模型越来越复杂,但我们希望交互体验变得更自然、更简单,让你完全不用关注用户界面,而只关注与[GPT]的协作。"...PC版:https://www.cnbeta.com.tw/articles/soft/1430761.htm手机版:https://m.cnbeta.com.tw/view/1430761.htm

封面图片

奥特曼“剧透”OpenAI发布会:不是GPT-5也不是搜索引擎 媒体爆料是语音助手

奥特曼“剧透”OpenAI发布会:不是GPT-5也不是搜索引擎媒体爆料是语音助手OpenAI的CEO萨姆·奥特曼在社交媒体上透露,公司将在本周一发布一款新产品,他形容这款产品“感觉像魔法一样”。虽然他明确表示新产品不会是GPT-5或搜索引擎,但暗示这将是一个大家会喜欢的东西。媒体报道指出,这款产品可能是一个AI语音助手,它不仅能识别物体和图像,还拥有超越现有产品的逻辑推理能力。OpenAI已经向一些客户展示了这款产品,并显示了其显著提升的逻辑推理能力。关注频道@ZaiHuaTG频道投稿@ZaiHuabot

封面图片

OpenAI CTO 表示她不知道 Sora 的训练数据来自哪里

OpenAICTO表示她不知道Sora的训练数据来自哪里人工智能公司OpenAI的首席技术官米拉·穆拉蒂本周与《华尔街日报》的乔安娜·斯特恩坐下来讨论了该公司即将推出的视频生成人工智能Sora。10分钟的采访进行到一半时,斯特恩直截了当地问穆拉蒂新模型的训练数据是从哪里收集的。但穆拉蒂目光闪烁以模糊的公司语言回答了这个问题。“我们使用了公开数据和许可数据,”穆拉蒂回答了这个极其简单的问题。斯特恩用更具体的来源示例反驳道:“那么,YouTube上的视频?”“你知道,如果它们是公开可用的——公开可用,”首席技术官回答道,“但我不确定。我对此没有信心。”随后,斯特恩询问了OpenAI与Shutterstock的数据训练合作情况,询问是否被纳入了Sora的训练材料中。“关于使用数据的细节,我是不会详细说的,”穆拉蒂继续说道。“但我们用的数据肯定是公开的,或者许可使用的。”——

封面图片

OpenAI CTO:GPT-5可能会在2025年底或2026年初推出

OpenAICTO:GPT-5可能会在2025年底或2026年初推出人工智能能力的重大飞跃人们早已期待着ChatGPT的下一个主要模型,而GPT-5将带来AI能力的实质性飞跃。OpenAI首席技术官MiraMurati在接受DartmouthEngineering采访时对其潜力提供了新的见解,该采访在X上分享。Murati将从GPT-4到GPT-5的进步比作从高中水平到大学水平的理解的增长,表明模型的复杂程度和能力得到了显著增强。GPT-5概述GPT-5在开发阶段的内部代号为Gobi和Arrakis,受到行业分析师的密切关注。在2024年洛杉矶BerggruenSalon上,微软首席技术官KevinScott强调了GPT-5通过复杂考试的潜力,反映了推理和解决问题方面的重大改进。他还指出,进入人工智能领域的门槛正在降低,这使得更强大的工具更容易被更广泛的受众所使用。GPT-5的培训将于2023年12月开始,预计将于2024年美国大选后公开发布。艾伦·汤普森(AlanD.Thompson)是人工智能专家,也是财富500强企业、主要政府和联合国成员国的顾问,他创建了一个综合的大型语言模型数据库。在最近的时间线评论之前,汤普森曾预测会公开发布GPT-5将于2024年12月美国大选后推出。时间表和延迟当被问及发布时间表时,Murati表示GPT-5可能会在2025年底或2026年初推出。这与之前的传言有所不同,之前的传言称最早将于2023年底推出,后来调整为2024年夏天。推迟的时间表可能会让那些渴望下一次重大进展的人感到失望。然而,穆拉蒂的澄清表明,额外的时间将使OpenAI能够开发出比之前预期更强大、更智能的系统。OpenAI首席执行官SamAltman最近出现在All-In播客中,他强调GPT-5没有固定的时间表。Altman提到,下一次迭代甚至可能不会被称为GPT-5,这强调了该项目的流动性以及对质量的重视,而不是遵守严格的时间表。GPT-5旨在实现博士级智能Murati声称GPT-5将在某些任务上实现博士级的智能,这一说法得到了业内领袖此前声明的支持。微软首席技术官KevinScott表示,由于记忆力和推理能力的提升,下一代人工智能系统将能够通过博士学位考试。Murati也表达了同样的看法,但她强调,这种高水平的表现将针对特定任务。当前的人工智能系统在某些领域已经展现出人类水平的能力,而GPT-5旨在进一步扩展这些能力,在复杂场景中展示高级推理和知识应用。...PC版:https://www.cnbeta.com.tw/articles/soft/1435761.htm手机版:https://m.cnbeta.com.tw/view/1435761.htm

封面图片

OpenAI CTO:GPT-5有望在2025年底或2026年初推出

OpenAICTO:GPT-5有望在2025年底或2026年初推出PANews6月24日消息,据华尔街见闻报道,OpenAI首席技术官MiraMurati近日透露,公司正在开发的新一代人工智能模型GPT-5,有望在2025年底或2026年初推出,在特定任务中达到博士级智能水平,标志着人工智能技术可能迎来又一次重大飞跃。据悉,GPT-5内部代号为“Gobi”和“Arrakis”,是一个具有52万亿参数的多模态模型,上一代GPT-4参数约为2万亿。这一庞大的参数规模暗示了其潜在的强大能力。Murati将GPT-4到GPT-5的进步比作从高中水平到大学水平的跨越,表明新模型在复杂性和能力上将有显著提升。值得一提的是,这一发布时间与早期传闻有较大出入,市场曾预测GPT-5可能在2023年底或2024年夏季发布,但Murati的最新表态将时间推迟到了2025年底或2026年初,OpenAICEOSamAltman曾强调目前没有固定的发布时间表。https://www.panewslab.com/zh/sqarticledetails/8l3zimgz.html

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人