ℹ补教业危险了?OpenAI GPT-4o 化身家教老师,引导学生解决困难数学问题#

ℹ补教业危险了?OpenAI GPT-4o 化身家教老师,引导学生解决困难数学问题# 整个过程 GPT-4o 都一直表现出鼓励的态度,就算找错答案也会指引你往正确的方向前进。通过询问的方式让学生自己去寻找解题过程,像是先寻找...

相关推荐

封面图片

ℹOpenAI 发表全新 GPT-4o 模型,免费/付费 ChatGPT 用户皆能使用#

ℹOpenAI 发表全新 GPT-4o 模型,免费/付费 ChatGPT 用户皆能使用# OpenAI 于稍早的发表会正式推出全新 GPT-4o 模型,整个演示过程可说让人非常惊艳,这也进步太多,特别是在即时回应这块。另外 Op...

封面图片

更像人类的GPT-4o:OpenAI的《Her》时刻

更像人类的GPT-4o:OpenAI的《Her》时刻 GPT-4o在保持GPT-4级别的智能的同时,对文本、视觉和音频功能进行了改进。OpenAI首席技术官(CTO)Mira Murati及其员工Mark Chen和Barret Zoph在现场演示时展示了新的音频对话和视觉理解能力。OpenAI声称,GPT-4o对音频输入的平均反应时间约为320毫秒。根据2009年的一项研究,这与人类在对话中的反应时间相似,而之前的模型通常要延迟2-3秒时间。除了响应速度,GPT-4o似乎很容易捕捉到情绪,并根据用户的要求调整语气和风格,甚至还在回应中加入了音效、笑声和歌声。GPT-4o更像人类GPT-4o在理解人类交流方面迈出了重要的一步,用户可以用一种接近自然的方式与其交谈。它伴随着现实世界中几乎所有的倾向,比如打断、理解语气,甚至意识到自己犯了一个错误。在第一次现场演示中,主持人要求GPT-4o对他的呼吸技巧做出反馈。他对着手机深深地吸了一口气,而ChatGPT则诙谐地回应道:“你不是吸尘器。”它建议使用一种速度较慢的技术,展示其理解和回应人类细微差别的能力。除了具有幽默感,ChatGPT也会改变回应的语气,在传达“思想”的同时用不同的语调来完成。就像人类对话一样,你可以打断它的对话并纠正它,让它做出反应或停止说话。你甚至可以要求它以某种语气、风格或机器人的声音来说话。此外,它甚至还可以提供翻译服务。在现场演示中,舞台上的两名演讲者,一名说英语,一名说意大利语,通过Chat GPT-4o的翻译进行对话。它可以快速将意大利语翻译成英语,然后无缝地将英语回复翻译回意大利语。据悉,Chat GPT-4o在50多种语言的速度和质量上都有所提高。OpenAI表示,这些语言覆盖了世界97%的人口。除了语音理解,Chat GPT-4o还可以理解视觉效果。例如,对于视频中的一道方程题,它可以指导你如何求解。另外,它还可以观看现场自拍,并提供描述,包括你的穿着,以及情绪。在演示中,Chat GPT-4o表示,主持人看起来很开心。在整个演示过程中,Chat GPT-4o工作得很快,在理解方面并不费力,也没有提出询问。与输入查询相比,与Chat GPT-4o的交流更自然。你可以自然地对着手机说话,并得到想要的回应,而不是用谷歌去搜索。电影《Her》中的萨曼莎此时,如果想到了《Her》(一部和AI虚拟人萨曼莎谈恋爱的电影),或者其他与AI相关的未来主义反乌托邦电影,你不是唯一的一个。以如此自然的方式与Chat GPT-4o交谈,本质上就是OpenAI的《Her》时刻。考虑到它将在移动应用程序和桌面应用程序上免费推出,许多人可能很快就会拥有自己的《Her》时刻。虽然并未在直播演示中现身,但OpenAI CEO 萨姆·奥特曼(Sam Altman)对这次演示做了重要的总结,称GPT-4o给人的感觉就像电影中的AI。他说:“新的语音和视频模型GPT-4o是我用过的最好的计算机界面,这感觉就像电影中的AI。而且,对我来说,它真实的仍然有点令人惊讶,达到了人类级别的响应速度和表现。最初的ChatGPT显示出了语言界面的可能性,但GPT-4o这个新事物感觉本质上有所不同,它快速、智能、有趣、自然、实用。”“对我来说,与电脑交谈从来都不是很自然的感觉;但现不同了,它变得自然了。随着将来不断地完善,我真的看到了一个令人兴奋的未来,我们能使用计算机做比以往任何时候都多的事情。”奥特曼还称,在创建OpenAI时,最初的想法是创造AI,并用它来为世界创造各种裨益。但如今,创造AI后,希望让其他人使用它来创造各种令人惊叹的东西,所有人都会从中受益。奥特曼还表示:“OpenAI是一家企业,会找到很多收费的东西,这将帮助我们为数十亿人提供免费的、出色的AI服务。”新的安全风险这场令人印象深刻的语音和视觉演示,可能只是触及了Chat GPT-4o各种可能性的皮毛。尽管其总体性能,以及在各种环境中的日常表现仍有待观察,但很明显,通过现场演示可以看出,Chat GPT-4o已经对谷歌和苹果的未来挑战做好了准备。OpenAI称:“Chat GPT-4o是我们第一个结合了上述所有技术的模型,我们目前只是触及到探索该模型的功能,及其局限性的皮毛。”Murati承认,Chat GPT-4o的实时音频和图像能力在安全方面带来了新的挑战。她表示,OpenAI将继续研究安全性,并在未来几周的迭代部署期间征求测试用户的反馈。OpenAI称:“Chat GPT-4o还与社会心理学、偏见和公平性等领域的70多名外部专家进行了广泛的合作,以识别新模型可能导致或放大的风险。我们利用这些经验来加强安全干预措施,以提高与Chat GPT-4o交互的安全性。一旦新的风险被发现,我们将采取措施降低它们。”GPT-4o前景展望在Google I/O大会开始的前一天,OpenAI发布了Chat GPT-4o,让我们见识到了人们想要的真正实用的AI体验。如果传闻中的与苹果的合作成为现实,那么Siri将如虎添翼。对于谷歌而言,几乎可以肯定的是,将在5月14日的I/O大会上展示其最新的AI技术。它能足以抵抗Chat GPT-4o吗?在不到30分钟的演讲中,OpenAI无法对Chat GPT-4o进行更多的现场演示。幸运的是,它将在未来一周向用户推出,且不需要支付费用。 ... PC版: 手机版:

封面图片

OpenAI 邀请了可汗学院的可汗和他儿子一起使用了 GPT-4o 辅导孩子在可汗学院上做数学题,一步步启发纠正,各种鼓励,比普

OpenAI 邀请了可汗学院的可汗和他儿子一起使用了 GPT-4o 辅导孩子在可汗学院上做数学题,一步步启发纠正,各种鼓励,比普通家长辅导效果可能真的要好不少!#视频 频道:@kejiqu 群组:@kejiquchat

封面图片

OpenAI再次加塞砸场?谷歌展示自己才是AI灭霸

OpenAI再次加塞砸场?谷歌展示自己才是AI灭霸 他们上次这么做还是是2月份,谷歌发布了多模态大模型Gemini 1.5 Pro,直接将性能拉到支持百万Token的业界新高。但这并没有成为那天的焦点,因为OpenAI在同一天发布了文生视频工具Sora,诸多栩栩如生又极具想象力的AI视频随即成为了社交媒体上的爆款,抢尽了谷歌Gemini的几乎所有风头。这一次OpenAI又搞突然袭击。谷歌I/O大会的日期是提前数月就宣布的,但OpenAI上周突然宣布在谷歌大会前一天举办发布会,在昨天发布了最新大模型GPT-4o(o代表着Omnimodel全能模型),提前引爆了AI大模型的关注热度,再次打乱了谷歌即将发布AI新品的传播节奏。GPT-4o不仅是完全免费的,而且覆盖了桌面与移动App,不仅性能大幅提升,而且可以综合处理文本、图片和音频,人机交互更加自然简单。举例来说,可以让GPT-4o加入网络会议,给用户记录发言总结概要。GPT-4o具体有什么用?用户可以让GPT-4o处理眼前的问题,极大提升生产力,可以与AI实时语音对话,就像是与真人聊天一样自然流畅,AI处理反应已经达到人类的速度,甚至还可以理解用户的情绪,以相应的情感作出回应。那么,面对OpenAI的故意撞车和抢占风头,谷歌在今天的I/O大会上又拿出了怎样的AI产品,是否带来了足够的震撼与新意?Gemini 1.5 Pro支持两百万Token谷歌I/O开发者大会今年已经进入了第16个年头,AI早已成为I/O大会的绝对乃至唯一的主角。谷歌CEO皮查伊更是在结束时宣布,整场发布会一共说了121次AI,引发了全场大笑。(这个梗是因为去年媒体统计谷歌在I/O上一共说了143次AI,今年谷歌干脆自己公布统计数字)。虽然整场发布会都没有提及竞争对手,但谷歌CEO皮查伊从主题演讲一开始就开始秀谷歌的AI实力,宣布谷歌已经全面进入Gemini时代。他强调谷歌已经在AI领域投入了十多年时间,贯穿了AI的每一层:研究、产品、基础设施。虽然AI新贵OpenAI在产品发布方面抢占了先发优势,但谷歌在研究论文、用户规模、产品数量以及算力方面都占据着压倒性优势,这也是OpenAI必须与微软结盟的直接原因,因为两家公司都不可能单独与谷歌掰手腕。皮查伊还宣布,Gemini大模型已经覆盖了谷歌全平台的20亿用户产品,仅仅三个月时间就有100多万用户注册使用。而两个月前发布的原生多模型Gemini 1.5 Pro已经得到超过150万开发者的使用。在性能方面,谷歌就是AI业界的灭霸。Gemini 1.5 Pro此前直接将Token(上下文处理)性能提升到了百万级别,全面压倒了受困于性能变慢的GPT-4.0 Turbo。三个月后,谷歌在今天宣布改进版的Gemini 1.5 Pro全面开放给Gemini Advanced的用户,并且支持35种语言。更为残暴的是,谷歌还将Gemini 1.5 Pro的上下文窗口处理性能直接翻倍到了200万(暂时只面向开发者提供),在这方面OpenAI只能望尘莫及。皮查伊宣布,这是朝着无限上下文的最终目标迈出的重要一步。Gemini 1.5 Pro可以给用户带来怎样的实际体验?谷歌用Workspace办公组件展示了AI给生产力带来的巨大变化。举例来说,如果是通过Google Meets进行远程会议,哪怕用户无法参会,也可以让Gemini为自己录音并列出会议纪要。有了Gemini,Gmail邮箱就有了灵魂。代写邮件已经是基本操作了。用户可以让Gemini帮助自己整理和总结Gmail的海量邮件,根据最近的收据和信用卡账单邮件整理归纳出用户的消费支出,给出一份专业又具体的财务支出清单。在电商时代,Gemini还能扮演智能管家的角色。用户甚至可以让Gemini自动在邮件中找到收据邮件,并进入商家平台申请退货,还能让快递上门取货。这一切都只需要用户向Gemini下达指令。Gemini 1.5 Pro从今天开始全面入驻Workspace Labs。轻量AI模型FlashGemini模型家族的新品还不仅于此。谷歌DeepMind CEO哈撒比斯(Demis Hassabis)在主题演讲中介绍了Gemini的新成员:轻量、迅捷、高效的模型1.5 Flash,以及未来AI助手Project Astra。去年12月,谷歌发布了第一代原生多模型Gemini 1.0,包括了Ultra、Pro以及Nano三个版本。三个月后谷歌发布了百万Token处理能力的Gemini 1.5 Pro。今天谷歌将Gemini 1.5 Pro处理能力提升到200万级别之外,还推出了轻量模型Gemini 1.5 Flash。虽然Gemini 1.5 Flash的上下文处理能力同样达到了百万级别,但却比1.5 Pro更为轻便迅速,针对低延迟和专注成本的任务进行了优化,更适合规模化构建。Gemini 1.5 Flash今天就会在通过谷歌AI Studio和Vertex AI两大平台向开发者提供。Project Astra是谷歌DeepMind打造的未来通用智能AI助手,也是对标OpenAI GPT-4o的产品。Astra不仅具备多模态处理,可以无缝应对文本图片视频等多媒体内容,还能以更为智能实时的方式与用户进行对话。或许略微遗憾的是,OpenAI已经在昨天抢先发布了GPT-4o的类似功能,晚了一天亮相的Astra少了诸多惊喜和震撼,或许这就是OpenAI突然抢先发布的主要原因。因为谁先发布就占据了媒体报道的焦点。如果OpenAI在谷歌Astra之后发布GPT-4o,同样也会失去诸多传播魅力所在。搜索更加人性与个性从搜索到邮件,从地图到图片,再到办公组件,谷歌有着太多上亿乃至十亿用户级别的产品可以承载AI落地。横跨iOS与Android平台,移动与桌面两端的20亿+的用户规模,以及几乎覆盖所有领域的产品,更是谷歌AI技术落地的庞大产品军火库。生成式AI在搜索领域的应用显然是最直接的用户体验。即便微软借助OpenAI试图弯道超车,但过去一年市场份额也只涨了不到一个百分点(目前3.64%)。而谷歌虽然市场份额减少了两个百分点,但目前全球市场占有率依然接近91%。有了Gemini大模型的加持,谷歌搜索得以全面提升,提供一对一的解答。用户可以随心所欲的提问,无论是具体知识,还是寻求建议,谷歌搜索的AI Overviews都可以应答如流,不仅给出实际的回答,更提供信息来源。具体来说,用户搜索“如何清洗布质沙发”的问题,AI Overviews不仅会提供几种清洗沙发的方法,还会带来答案的信息来源,再附上清洗产品的链接(购买谷歌搜索广告的商家产品)。未来用户还可以根据自身需求,对AI Overview的回答进行个性化调整,提供更为简明扼要或者细节详尽的回答。实际上,此前已经有不少用户已经通过Search Labs的实验功能体验到了AI Overviews功能。AI Overviews今天正式在美国市场推出,未来会逐步扩展到其他国家市场。谷歌预计,单是本周时间就会有数亿用户使用到AI Overviews,今年年底用户规模或将突破10亿级别。AI功能全面落地手机端虽然I/O主题演讲开始78分钟之后,谷歌才开始介绍Android平台的AI新功能,但这并不意味着Android在谷歌AI战略的重要性降低。实际上,移动端才是用户体验谷歌AI功能的最直接平台。在今年年初三星手机推出谷歌AI技术加持的画圈搜索、全屏翻译等人性功能之后(三星国行版使用百度AI技术),半年时间全球已经有超过1亿设备搭载了谷歌画圈搜索功能。谷歌预计今年年底这一数字将翻一倍,达到两亿设备。而且,得益于谷歌LearnLM模型,画圈搜索功能还有了更多的实际运用。从今天开始,画圈搜索将帮助学生做家庭作业,替代家教作用,帮助他们更好了解如何做题,而不仅仅是给出直接答案。这也是昨天OpenAI GPT-4o所展示的使用场景。Gemini on Android是谷歌为Android平台推出的一系列人性化功能。有了这一功能,用户可以用对话的方式,在写邮件和发短信的过程中直接生成和发送个性化图片,可以在YouTube视频中直接寻找想要的内容,在PDF中迅速找到自己所需的内容,而不用再自己费力浏览搜索。在Android设备端上的Gemini Nano模型还带... PC版: 手机版:

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人