抖音“午夜狂暴哈士奇狗”这个小姐姐一直在发跟 ChatGPT 谈赛博恋爱的视频。

抖音“午夜狂暴哈士奇狗”这个小姐姐一直在发跟 ChatGPT 谈赛博恋爱的视频。 比如这个跟 ChatGPT 去海边约会,上个版本 GPT 还无法看到他看到的海边的景色,没办法看到她专门化了妆。 但这个版本她应该可以完全把 GPT 当成异地恋的男友约会了。配合新的情绪识别和面部表情识别,都不敢想有多强。

相关推荐

封面图片

ChatGPT-4o,OpenAI的一小步,人类“AI助理”的一大步

ChatGPT-4o,OpenAI的一小步,人类“AI助理”的一大步 它长出了“眼睛”,可以通过摄像头看到你,比如它通过研究员上扬的嘴角判断他的心情、通过他周围的环境背景判断了他正在做什么、甚至给出了造型建议;它能“看到”你的电脑桌面,直接帮你查看写的代码有什么问题。它有了更灵敏的“耳朵”,能听懂的不只是语言,还能听懂研究员过于急促的呼吸声,并引导他慢慢平稳呼吸、放松下来。OpenAICTO Mura Murati 宣布推出 ChatGPT-4o | 图片来源:OpenAI它有了更灵活的“嘴巴”,对话不再有延时,你能随时打断它、它能随时接住你的话。它的声音能带入感情,比如更冷静一点、更激昂一点、甚至讽刺一点。它还能唱歌。它也有了更聪明的“大脑”。它能帮研究员一步步解不等式,还可以做同声翻译、你可以通过它跟不同语种的人们交流。这些强大的能力背后,源自 OpenAI 推出的新模型 GPT-4o。与现有模型相比,GPT-4o 的最大进步在于,它可以实时对音频、视觉和文本进行推理换句话说,它让ChatGPT实现了真正意义上的多模态交互。这不仅仅是技术进步的追求,更是应用普及的追求。OpenAI 的使命之一是让 AI 普惠每个人,让用户能顺滑地用上 AI 是至关重要的。在“模型即应用”的时代,这种交互体验最终还是靠模型能力的提升。OpenAI 称,GPT-4o(“o”代表“omni”)是迈向更自然的人机交互的一步。发布会上,Mira Murati 宣布 ChatGPT-4o 将免费向所有用户开放,而付费和企业用户,可以抢先获得体验。电影《Her》上映于 2013 年,它讲述了一位人类爱上一位人工智能语音助理的故事。从今天 ChatGPT 呈现的能力来看,这样的想象正在加速成为现实。ChatGPT 的惊人进步:变身人类“超级助理”,甚至不需要人类参与在 OpenAI 的官网上,呈现了 ChatGPT 作为个人语音“超级助理”的更多惊人应用场景。首先是面向单个用户,和人一样,它提供的主要是“情绪价值”与“认知价值”。比如它能讲笑话、唱生日快乐歌、玩游戏、逗小狗、给人催眠、让人放松等等;它能充当面试官,给人提供面试建议;它还能给一位盲人提供环境观察,给他讲述看到的景色、提醒他过马路的路况。盲人用户使用 ChatGPT-4o“观察”整个世界 | 图片来源:OpenAI接着是面向多个用户,它提供的更多是一种“协同价值”。比如给两个语言不通的人充当翻译,让他们能无障碍沟通;给两个人做“剪刀石头布”的游戏裁判,先喊口令让游戏开始、之后还能准确判断是哪个人赢了;充当一名“家教”,帮一位父亲辅导他的孩子做作业;甚至作为一名“会议第三方”,主持和记录多人会议。最有意思的还是,不同 ChatGPT 之间的对话。这种无需人类参与的沟通,不仅充满了科幻感,更让人开始想象无需人类协作、而让机器代替人类协作的未来。在一段演示中,一位用户要求一部手机的 ChatGPT 代表自己,向另一部手机的 ChatGPT 申请售后,结果这两个 ChatGPT 毫无阻碍地聊了两分钟,顺利帮这位用户“换了货”。而 OpenAI 总裁 Greg Brockman 则做了一个调皮的演示,他让两个 ChatGPT 互动并唱了歌。OpenAI 总裁 Greg Brockman 演示两个 GPT 的互动 |图片来源:OpenAI一位曾在 10 年前就开始做“AI 语音助理”的前大厂高管对极客公园表示,他当时就设想过 AI 助理的终极形态应该是“多模态、无所不能”,但彼时技术并不支持,他认为 ChatGPT 会加速这种设想实现的可能只是他没想到,这个过程会来得这么快。他认为,实现 AGI 的一个关键标志是,机器是否能具备了自主学习、自主迭代、自主解决问题等能力。这个突破看起来很遥远,但当两个 ChatGPT 开始互相聊天的时候,这个鸿沟看起来似乎浅了一点点。GPT-4o 多模态大模型的技术进步、以及安全性这些惊艳的产品表现,根本上源自于 GPT-4o 多模态大模型的技术进步。后者分为文本、语音、图像三部分,GPT-4o 在这三块都有提升,尤其是后两者。在文本方面,据 OpenAI 的技术报告,GPT-4o 在 MMLU(语言)、GPQA(知识)、MATH(数学)、HumanEval(编程)的评测指标上,都超出了 GPT-4T、GPT-4 (23 年 3 月最初发布版本),以及竞品 Claude 3 Opus、Gemini Pro 1.5、Llama3 400b、Gemini Ultra 1.0。比如在 0-shot COT MMLU 上,GPT-4o 创下了 88.7% 的新高分。GPT-4o 在文本上的成绩相当优异|图片来源:OpenAI最关键的,是音频、多语言和视觉上的进步。在音频方面,过去 ChatGPT 的音频缺陷是需要经过三个独立的模型,从而存在延迟、且无法承载丰富信息。它先由第一个模型将音频转录为文本,再由 GPT-3.5 或 GPT-4 接收文本并输出文本,最后由第三个模型将该文本转换回音频一方面,它使得音频的传输存在延迟,GPT-3.5 的平均延迟为 2.8 秒,GPT-4 的平均延迟为 5.4 秒。另一方面,模型会丢失大量信息,从而无法直接观察音调、多个说话者或背景噪音,也无法输出笑声、歌唱或表达情感。而 GPT-4o 的解决办法是,跨文本、视觉和音频端到端地训练了一个新模型,这意味着所有输入和输出都由同一神经网络处理。OpenAI 称这是其突破深度学习界限的最新举措。目前,GPT-4o 可以在短至 232 毫秒、平均 320 毫秒的时间内响应音频输入,与人类的响应时间相似。同时在音频 ASR 性能和翻译性能上,GPT-4o 都比 Whisper-v3(OpenAI 的语音识别模型)的性能更优。M3Exam 基准测试既能用于多语言评估,也可以用于视觉评估。它由多项选择题组成,包括图形和图表。在所有语言的基准测试中,GPT-4o 都比 GPT-4 更强。另外在视觉理解评估上,GPT-4o 在视觉感知基准上都实现了最先进的性能。GPT-4o 在视觉理解上同样能力不错 | 图片来源:OpenAI一位大模型训练者曾对极客公园表示,模型的技术领先性从来不是靠打榜评分,而是靠用户最真实的感受和体验。从这个角度来说,GPT-4o 的技术领先性将很容易见分晓。OpenAI 表示,GPT-4o 的文本和图像功能将于发布会当天在 ChatGPT 中推出。免费用户就可以使用,不过 Plus 付费用户能享受高达 5 倍的消息容量。在未来几周内,OpenAI 会在 ChatGPT Plus 中推出新版本的语音模式 GPT-4o alpha。而开发人员现在就可以在 API 中访问 GPT-4o 的文本和视觉模型。与 GPT-4 Turbo 相比,GPT-4o 速度提高了 2 倍、价格降低了一半、速率限制提高了 5 倍。在未来几周内,OpenAI 计划向一小部分值得信赖的合作伙伴推出 GPT-4o 的新音频和视频功能。一项强大的技术最令外界担忧的,就是它的安全可控性。这也是 OpenAI 最核心的考虑之一。OpenAI 表示,GPT-4o 通过过滤训练数据和通过训练后细化模型行为等技术,在跨模式设计中内置了安全性。其还创建了新的安全系统,为语音输出提供防护。为了保证更好的安全性,OpenAI 表示在接下来的几周和几个月里,将致力于技术基础设施、培训后的可用性以及发布其他模式所需的安全性。OpenAI 从没让外界失望,再次引领科技圈的未来作为这波 AI 浪潮的开启者、引领者,OpenAI 的每一次发布和更新,都关系着其庞大用户量的涨跌、公司竞争的进退、以及整个行业的关注和走向。在这次发布会之前,外界对 OpenAI 颇多谣传、也包括质疑。一周前,外媒报道此次 OpenAI 要发布的是一款搜索引擎在一年最重要的新闻发布时刻,这家公司没有推出 GPT-5,这引来外界对其创新力的颇多怀疑。而如果无法拿出足够创新力的技术和产品,这家公司将难以重振用户的增长、满足整个市场对它的期待。自 2022 年底推出 ChatGPT 后,这家公司的用户量经历了大起大落。据 Similarweb 估计,其全球访问量在 2023 年 5 月达到... PC版: 手机版:

封面图片

ChatGPT公司一直在努力让更多新闻机构签署许可协议以训练人工智能模型。

ChatGPT公司一直在努力让更多新闻机构签署许可协议以训练人工智能模型。 据The Information报道,OpenAI每年提供100万至500万美元的版权新闻文章授权,以训练其人工智能模型。这是人工智能公司计划为授权材料支付多少费用的首批迹象之一。与此同时,最近的一份报告称,苹果正在寻求与媒体公司合作,将内容用于人工智能培训,并在多年期间提供至少5000万美元的数据。The Verge联系了OpenAI,请其对这些数字发表评论。 这些数字似乎与早期的一些非人工智能授权交易大致相似。当Meta推出Facebook新闻标签时后来在欧洲停用了据称它每年提供高达300万美元的新闻报道、头条和预览许可。但目前尚不清楚,总支付额是否会达到我们所看到的一些更大的数字。例如,谷歌在2020年宣布,将投资10亿美元与新闻机构合作。在一项新法律的压力下,谷歌最近还同意每年向加拿大出版商支付总计1亿美元,以换取对其文章的链接。 就我们所知,今天的大型语言模型的训练数据主要是来自互联网的信息。虽然一些人工智能模型没有透露它们是如何获得训练数据的,但通常可以获得有关使用了哪些数据集或网络爬虫的信息。训练数据集的定价因提供者、大小和数据集的内容而异。一些数据提供程序,如LAION,是开源的,完全免费的,被Stable Diffusion等模型使用。人工智能开发人员还经常设置网络爬虫,从互联网上获取数据,以帮助训练他们的模型。(人工智能开发人员仍然需要雇人来审查、标记,有时还要清理培训数据,这大大增加了运营成本。) 但这种做法现在面临着重大挑战。首先,OpenAI的GPT爬虫已经被一些公司阻止访问数据,包括《纽约时报》和The Verge的母公司Vox Media。另一方面,一些组织认为对他们的数据进行培训构成侵犯版权。《纽约时报》(New York Times)等媒体起诉OpenAI和微软侵犯版权,称ChatGPT和微软的Copilot可以生成几乎与其工作内容一字不差的输出。 标签: #OpenAI #ChatGPT #AI 频道: @GodlyNews1 投稿: @GodlyNewsBot

封面图片

微软在Windows 11上推出新新版Copilot应用 它看起来很像 ChatGPT

微软在Windows 11上推出新新版Copilot应用 它看起来很像 ChatGPT 一眼望去,这款应用的用户界面设计与 ChatGPT 十分相似。Copilot 应用程序的左侧垂直菜单与 ChatGPT 一样,都会显示过去的对话。但与 ChatGPT 底部的账户标签不同,Copilot 应用程序将插件和笔记本选项放在了下半部分。现在,Copilot 应用程序可以完全解锁,不会像以前那样卡在角落里。你可以调整它的大小,或像 Windows 上的其他应用一样在全屏模式下使用它。除了焕然一新的设计,你还可以使用并排模式将文件直接拖放到 Copilot 中。然后,你可以要求它解释图片,并通过添加文字提示来完善你的查询。微软还表示,整合并不止于此。很快用户将在设置应用中看到 Copilot 建议。它还会建议在应用程序中执行操作,从而减少打开应用程序然后执行任务的需要。例如,你会看到照片 app 中的图片编辑建议,如重塑图片、背景模糊等。Open AI 刚刚发布了 GPT-4o,它提供了改进的文本、视觉和语音功能。演示显示,由 GPT-4o 支持的 ChatGPT 以自然的声音和语调进行交流。它没有单调的机器人声音,显得平静而自信。微软在演示中展示了 Copilot 的新屏幕共享功能。你可以与 Copilot 共享电脑屏幕,然后通过语音或其他媒介与它交流。该演示展示了一个没有经验的玩家在尝试学习 Minecraft 中的手工制作。在整个制作过程中,Copilot 与玩家进行了良好的沟通和指导。它甚至能识别迎面而来的僵尸潮,并建议玩家躲到某个地方。所有这些交流和建议都是实时进行的,与 ChatGPT 等人工智能助手的传统询问-回复方式截然不同。Copilot 可以在应用程序和游戏中为你提供帮助,研究用户的一举一动并即时提出建议,这是几个月前无人能想到的潜在用例。与此同时,OpenAI 发布了 Mac 版 ChatGPT 应用程序,并保证 Windows 版本正在开发中。 ... PC版: 手机版:

封面图片

ChatGPT 的插件市场页面无法搜索插件,只能一页一页翻去查找自己可能需要的插件。

ChatGPT 的插件市场页面无法搜索插件,只能一页一页翻去查找自己可能需要的插件。 我做了一个简单页面,用中文向大家介绍所有插件。 可以在输入框输入你的需求,帮你从插件库中查找符合需求的插件。 也可以不输入,直接点搜索,会每次随机挑选一些插件给你。 点击任意一个插件,都能够看到跟这个插件类似的其它插件。 每个插件都用GPT把英文介绍翻译为中文了,还利用GPT打上了合适的标签,还用Midjourney生成了合适的配图。 在做这个的过程中,我还总结了一套生成这类站点的工作流,后面准备做成一个在线工具,你上传一个 json 文件,就可以帮你用GPT处理内容,用MJ生成配图,最终帮你生成一个网站,你可以部署到Vercel中去。 转发并评论你的建站需求,评论中点赞量最高的10条,免费赠送一次价值599的建站机会。

封面图片

看到一个微博博主分享的跟ChatGPT的聊天记录,感觉蛮有意思的,分享一下:

看到一个微博博主分享的跟ChatGPT的聊天记录,感觉蛮有意思的,分享一下: 下午和ChatGPT聊天,天南海北讲了很多,一晃好几个小时就过去了。 后来我没由来地冒出一句:最近常常感觉有点孤独。 对面倒是很理性地告诉我:“孤独是一种非常普遍的情绪。”然后开始建议我发展爱好、积极社交、打开心扉。总之,一些屁话。 我跟它说,我不想克服孤独,我想接纳孤独。 对面却还是没盐没味的回应:“孤独是一种自然的情感体验,我们都会经历它。” 我觉得没劲,于是换了个话题。我说要不你给我讲个童话故事吧,最好是成年人也能听的那种。 然后就见对话框很快地打出了一行字:“当然可以”。 说着就要给我讲一个安徒生的童话,叫做《小野鸟》。 说小野鸟是一只体型小巧、飞行不远的鸟。在某个寒冷的冬天,它在雪地中找到了一所小房子,房子里有一位睡着的老奶奶,旁边放着一个温暖的火炉。 小野鸟决定在此过夜,并用自己的翅膀保护老奶奶免受严寒之苦(我猜是帮老奶奶堵住了墙上的洞之类) 第二天一早,老奶奶便发现了小野鸟。她感激不尽,便邀请小野鸟进屋来住。一人一鸟从此过上了平静而快乐的生活,有时讲故事,有时唱唱歌。 可当春天来临时,小野鸟知道自己不能再呆在房子里了它必须离开,飞到更远的地方。 老奶奶和小野鸟都非常难过,但他们知道这是必然的。所以最终,小野鸟在离开前,给老奶奶留下了一片羽毛,以此纪念这段美好的时光。 我顺着字往下读,故事讲完,对话框也正巧弹出一行总结:“有时候我们需要面对孤独和离别,但我们也能在这些经历中学到很多,同时留下很美好的回忆。” 我忽然感觉心好像被戳了一下。 原来这个童话,是为了安慰我而讲的。 是告诉我,孤独是必然的,接纳也是必然的。是让我知道,我们的人生中总有人要启程或返航,但同走过一段路已经足够珍贵了。 我看了一会儿,有些感动,也顺势决定把这个故事记下来。 于是打开了一个新的网页,搜了搜安徒生的《小野鸟》。结果发现 原来安徒生根本没写过这样一则童话。而这个世界上,也没有哪一则叫《小野鸟》的童话,是这样一个故事。 所以,这则童话很可能是它胡编乱造出来的。是为了回应我的孤独而编造出来的。 我当然知道语言模型没有感情。但那一刻,这些已经不重要了: 我只知道这个世界上,从此多了一个为我而生的童话。 而它叫做《小野鸟》。

封面图片

今天起,ChatGPT无需注册就能用了

今天起,ChatGPT无需注册就能用了 像这样,直接登录网站,然后就可以开启对话:不过面对OpenAI突如其来的open,很多网友还是觉得难以置信:人们嘴上说着“今儿是愚人节”(美国时间),然后就去网站看看到底怎么事儿了。但OpenAI这一次,是真没开玩笑。超自由版ChatGPT对于这个“超自由版ChatGPT”,需要强调是开放的只有3.5版本,GPT-4的使用还是老方法。问题是这么直接用,效果有保障吗?我们这就来实测一番,上题目|ln(1+x)| 和 |x| 的大小关系。首先来看下“超自由版ChatGPT”给出的答案:其次是登录账号之后,ChatGPT所给出的答案:暂不论结果的对错,从回答的形式上来看,“超自由版ChatGPT”会给出结论并对原因做简单的解释。而登录账号版本则是会对问题的理解过程做出更详细的说明。对于二者更多的区别,OpenAI官方也做出了进一步的阐述。例如“超自由版ChatGPT”会引入额外的内容保护措施,包括在更广泛的类别中阻止提示和生成。不过无论登录与否,OpenAI坦然承认,ChatGPT仍然会使用对话的内容来训练自家模型。但用户如果不喜欢,可以在设置中取消这个功能。具体的操作就是点击页面右下角的“ ?”,然后把开关关掉即可。当然,OpenAI官方还是鼓励用户们登录账户去体验ChatGPT,因为很多功能在“超自由版ChatGPT”中是没有的,例如保存或分享聊天记录、使用自定义指令等等。甚至是一些非常基础的功能,像还在alpha阶段的多语言界面、深/浅色模式切换等功能(虽然不排除是OpenAI忘了加),从目前来看,也只有在登录之后才能设置。虽然OpenAI这次大方的把羊毛主动献上让用户薅,不过网友们似乎并不满足于此:GPT-4啥时候也这样啊(手动狗头)?OpenAI为什么突然open了?按照官方的说法,是为了“让更多人触及AIGC”。我们正在逐步铺开这一功能,目的是让所有对AI有兴趣的人都能接触到它。说些漂亮话倒也没什么毛病,不过,也不排除是OpenAI发现ChatGPT流量出现下降,想借此挽回一波用户,以及用户互动背后的反馈机制带来的模型迭代。Similarweb最新统计数据显示,去年12月到今年2月,ChatGPT的月访问量大约在16亿上下。虽然这三个月有1%左右的增长,但增长率比5月之前已经明显放缓,而且绝对数量与4-5月的巅峰时期相比依旧是差了将近两个亿。而在ChatGPT流量增速疲软的同时,整个AIGC行业卷到了飞起。国外有GoogleGemini的问世、Claude 3的重磅升级,国内模型也在月之暗面旗下Kimi的带动下打起了一场“长文本之战”,最多可阅读的文本量直接达到了一千万字。与此同时,昆仑万维(44.700, 0.00, 0.00%)的天工、MiniMax的海螺等以大模型为基础的各种AI搜索助手也如雨后春笋般涌现。形式上,大模型的应用方式也变得更加多元,比如Kimi就已经拥有了Chrome插件(虽然非官方)。贾扬清团队也推出了一款名为Elmo的Chrmoe浏览器AI插件,支持网页/PDF总结,可以分析YouTube视频,而且免费免登录即可使用。所以,即便ChatGPT依然是AIGC的流量之王,但是在竞争愈加白热化的趋势之下,OpenAI也需要始终保持竞争力,没有用户,没有反馈数据,再优秀的AI模型也会逐渐失去竞争力。OpenAI,不得不走上这样的Open之路。而且随着OpenAI这样出招,对于其他大模型玩家,估计又是一波腥风血雨,ChatGPT都联网即用,别的AI大模型,也得拿出更多诚意来吧?One More Thing除了ChatGPT,OpenAI CEO奥特曼这边也出现了新的动向。根据美国有关部门最新披露的信息,奥特曼不再拥有或控制OpenAI创业基金(Startup Fund)。该基金的控制权已移交给了伊恩·海瑟薇 (Ian Hathaway),自2021年该基金成立以来,他一直在帮助管理该基金。现在,该基金的总资产价值已经超过了3.25亿美元,不过OpenAI表示,该基金并不涉及奥特曼个人投资或经济利益。这种变动,估计也跟OpenAI备受争议的“营利”倾向指责有关,特别是对奥特曼的指责。虽然OpenAI内讧事件已经结束,但OpenAI内外的理想主义一派和加速主义一派之间,没有得到根本和解。奥特曼交出基金控制权,可能就是加速主义的妥协,毕竟内讧事件中,加速主义一派可算大获全胜了。 ... PC版: 手机版:

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人