具有视觉功能的 GPT-4 Turbo 正式发布

具有视觉功能的GPT-4Turbo正式发布人工智能公司OpenAI宣布，具有视觉功能的GPT-4Turbo模型GPT-4TurbowithVision现已通过其API向开发人员提供。该模型延续了GPT-4Turbo系列128,000个token的窗口大小和截止至2023年12月的知识库并新增了视觉理解功能。视觉请求现在可以使用JSON模式和函数调用。——

在Telegram中查看

相关推荐

微软宣布带有视觉功能的GPT-4 Turbo可在Azure OpenAI服务上全面启用

微软宣布带有视觉功能的GPT-4Turbo可在AzureOpenAI服务上全面启用微软在一篇博文中表示，瑞典中部和美国东部2个AzureOpenAI区域的客户可以部署新的"gpt-4-turbo-2024-04-09"模型。这是一个多模态模型，能够处理文本和图像输入以生成文本输出。博客还补充道：我们的客户和合作伙伴一直在利用GPT-4TurbowithVision创建新流程、提高效率并创新业务。应用范围从改善在线购物体验的零售商，到丰富数字资产管理的媒体和娱乐公司，以及从图表中获得洞察力的各种组织。一些功能，如光学字符识别(OCR)、对象接地、视频提示和"在您数据中使用图像"，可在公开预览版模型中使用，但目前还不能在通用版中使用。微软表示，它正在"积极探索如何在未来的模型更新中最好地集成这些功能"。微软还补充说，"涉及图像（视觉）输入的推理请求的JSON模式和函数调用"将在不久的将来添加到AzureOpenAI服务客户的新模式中。该公司此前宣布，带有视觉功能的GPT-4TurboAzureOpenAIService客户的定价为输入每1000个词元0.01美元，输出每1000个词元0.03美元，增强功能的定价不同。微软最近宣布，它正在AzureOpenAI服务中测试一项新的"风险与安全监控"功能。该功能旨在让企业实时了解其人工智能系统的运行情况。它还能让企业了解黑客等人员是否试图滥用这些系统。了解更多：https://techcommunity.microsoft.com/t5/ai-azure-ai-services-blog/announcing-the-general-availability-of-gpt-4-turbo-with-vision/ba-p/4127916...PC版：https://www.cnbeta.com.tw/articles/soft/1429399.htm手机版：https://m.cnbeta.com.tw/view/1429399.htm

OpenAI新GPT-4 Turbo模型已可使用四项能力提升

OpenAI新GPT-4Turbo模型已可使用四项能力提升不过更强大的能力同时也意味着更长的响应时间与更高的成本，对于预算有限的项目来说，这也是一个重要的考虑因素。据悉，OpenAI在4月10日正式发布了GPT-4Turbo，用户可以根据需求构建自己的GPT。GPT-4Turbo和GPT-4的主要区别在于几个方面：上下文窗口：GPT-4Turbo拥有更大的上下文窗口，可以处理高达128K个token，而GPT-4的上下文窗口较小。模型大小：GPT-4Turbo的模型大小为100B参数，这意味着它可以处理更多信息，生成更复杂和细腻的输出，而GPT-4的模型大小为10B参数。知识截止日期：GPT-4Turbo的训练数据包含到2023年4月的信息，而GPT-4的数据截止于2021年9月，后来扩展到2022年1月。成本：对于开发者来说，GPT-4Turbo的使用成本更低，因为它的运行成本对OpenAI来说更低。功能集：GPT-4Turbo提供了一些新功能，如JSON模式、可复现输出、并行函数调用等。总的来说，GPT-4Turbo的更新更重要的是完善了功能，增加了速度，准确性是否提高仍然存疑。这或许与整个大模型业界目前的潮流一致：重视优化，面向应用。而有可能再次颠覆AI领域的GPT-5，预计将在夏季推出。...PC版：https://www.cnbeta.com.tw/articles/soft/1427055.htm手机版：https://m.cnbeta.com.tw/view/1427055.htm

微软Azure OpenAI服务在公开预览版中增加了带视觉功能的GPT-4 Turbo

几周前，OpenAI在其首次开发者活动中发布了用于生成式人工智能服务的最新大型语言模型GPT-4Turbo。随后，微软宣布将把GPT-4Turbo模型添加到其AzureOpenAI服务中。今天，微软宣布增强其AzureOpenAI服务，GPT-4TurbowithVision模型现已作为公开预览版提供给客户。此外，微软还通过GPT-4TurbowithVision预览版为AzureOpenAI客户增加了更多功能。其中之一是光学字符识别（OCR），它可以检查图像并提取图像中的任何文本，以便将其整合到用户提示中。GPT-4TurbowithVision的另一项功能是对象接地，它可以让人工智能检查图像，并根据用户的文本提示显示图像中的关键对象。同样，人工智能还可以分析视频的特定帧。标签:#OpenAI#微软#Azure频道:@GodlyNews1投稿:@GodlyNewsBot

微软宣布免费版Copilot已换成GPT-4 Turbo

微软宣布免费版Copilot已换成GPT-4TurboGPT-4Turbo版是OPENAI在2023年11月份推出的新模型，支持128K上下文，微软则是在2023年12月在MicrosoftCopilot中添加了GPT-4Turbo的支持。不过这种新模型在微软这里也是要付费的，那就是需要开通20美元/月的CopilotPro订阅后才能使用GPT-4Turbo。现在，微软宣布所有用户都可以免费使用GPT-4Turbo，现在免费版Copilot也已经替换成GPT-4Turbo模型，微软称这经过了相当多的工作。目前Copilot提供CopilotforWindows版、网页版以及集成在MicrosoftEdge浏览器中，对于受支持的国家或地区，用户可以通过任意一种方式免费使用GPT-4Turbo。来源，频道：@kejiqu群组：@kejiquchat

OpenAI：新GPT-4 Turbo模型现可供付费ChatGPT用户使用

OpenAI：新GPT-4Turbo模型现可供付费ChatGPT用户使用OpenAI在社交平台X宣布，新GPT-4Turbo模型现已可供付费ChatGPT用户使用。OpenAI表示，其提升了该模型写作、数学、逻辑推理和编码的能力。据OpenAI介绍，GPT-4Turbo现已在ChatGPTPlus、Team、Enterprise和API中可供使用。线索：@ZaiHuabot投稿：@TNSubmbot频道：@TestFlightCN

五分钟速览OpenAI发布会：GPT-4 Turbo模型、GPT应用商店等登场

五分钟速览OpenAI发布会：GPT-4Turbo模型、GPT应用商店等登场（来源：OpenAIDevDay）在发布会的开始，奥特曼简短回顾了公司过去一年的发展历程，特别提到“公司在今年3月发布的GPT-4，至今仍是世界上能力最强的AI大模型”。时至今日，已经有200万开发者正在使用OpenAI的API（应用程序接口），在全球各地提供多种多样的服务；92%的财富500强公司正在使用OpenAI的产品搭建服务，而ChatGPT的周活用户数也达到1亿人。GPT-4Turbo模型登场随后便进入了新品发布时间，首先登场的是GPT-4Turbo模型。简单来说，相较于全球股民都很熟悉的GPT-4，GPT-4Turbo的进步主要体现在6个方面。1、AI能够理解更长的上下文对话长度（contextlength）。标准版GPT-4模型最多支持8192个token，此前的升级将其提高至最多3.2万个token。而GPT-4Turbo支持最高12.8万个token，相当于一本标准大小的300页纸质书所包含的文本量；奥特曼也表示，新模型在处理长文本情境下的准确度也有所提高；2、给予开发者更多的控制权。新的模型允许开发者指示模型固定以特定形式返回有效JSON—JSON模式。同时开发者可以通过访问seed参数和system_fingerprint响应字段，来实现“模型对每次请求都给出确定性的输出”。3、GPT-4对于现实世界的知识截止于2021年9月，GPT-4Trubo的知识则截止于2023年4月。4、多模态API来了。文生图模型DALL·E3、具有视觉输入能力的GPT-4Trubo，以及新的声音合成模型（TTS）都在今日进入API。OpenAI也在今天发布了新的语音识别模型WhisperV3，将在近期向开发者提供API。5、继向全球开发者开放GPT3.5微调（Fine-tuning）后，OpenAI宣布将向活跃开发者提供GPT-4微调的资格。对于开发细分行业的垂直AI应用而言，微调是必经的过程。对于这类开发者，OpenAI也推出了定制化模型项目，帮助一些组织训练针对特定领域的定制化GPT-4模型。奥特曼也表示，这件事情一开始并不会便宜。6、OpenAI将所有GPT-4用户的Token速率限制扩大了一倍，开发者可以申请进一步提高速率。与微软、Adobe类似，OpenAI也引入了“版权护盾”机制。在ChatGPT企业版用户和API用户遭到版权官司时，公司将会出面辩护，并支付因此产生的赔偿责任。在市场极为关注的定价方面，作为行业领先的大模型，GPT-4Turbo的价格要远低于GPT-4。其中输入Token的价格只有三分之一，而输出Token的价格只有一半。也就是说，输入1000个Token的定价为1美分，而输出1000个Token的定价为3美分。与此同时，GPT-3Turbo16K模型的价格也有所下调。（新定价表，来源：OpenAI）在新品发布间隙，微软CEO纳德拉也来到现场，猛夸了一顿OpenAI并再次强调“微软深爱着OpenAI”。ChatGPT也有更新奥特曼宣布，虽然今天是开发者大会，但OpenAI也忍不住对ChatGPT做出一些更新。首先，从今天开始ChatGPT将使用刚刚发布的GPT-4Trubo模型。另外，针对用户每次对话前都要选择不同模式的困扰，GPT-4Trubo也将迎来产品逻辑的更新，现在机器人能够主动根据对话来适配对应的功能。更新前更新后接下来本场活动的第二个重要产品登场——GPTs。用户将能通过自定义指令、拓展（模型）的知识边界和下达行动命令，来构建自己的GPT，并能对外发布给全球更多的人使用。更重要的是，整个构建“自定义GPT”的过程也是通过自然语言对话形成的。奥特曼也在现场演示了如何通过聊天搭建一个GPT。他给GPTBuilder的指令是“希望帮助创业者思考商业灵感并提供建议，然后‘拷问’他们为何公司发展得不够快。”随后ChatGPT迅速搭建了一个创业咨询GPT，还顺手生成了一个Logo。随后奥特曼在属性页面中上传了一份他自己关于创业公司的演讲稿，向这个用例提供了额外的知识。至此，自定义用途的GPT初步搭建完成。用户可以保存这个用例只给自己使用，也能对外公开发布。既然说到“公开发布”，OpenAI也顺势宣布，将在本月晚些时候上线“GPT应用商店”。对于那些最热门的GPT，公司还将分享一部分的营收，来推进GPT应用生态的进步。AssistantsAPI最后是面向开发者的新品AssistantsAPI。“助理API”是一个专门构建的人工智能，具有特定的指令，利用额外的知识，并能调用模型和工具来执行任务。新的助手API提供了如代码解释器、检索以及函数调用等功能，以处理此前开发者必须自己完成的诸多繁重工作。OpenAI介绍称，这个API的用例范围非常灵活，例如基于自然语言的数据分析应用、编程助手、AI度假规划器、语音控制DJ、智能视觉画布等等。作为示例，OpenAI的首席开发者体验官RomainHuet搭建了一个“知晓整场开发者大会”的用例，并调用Whisper来实现语音输入。同时由于这个API可以联网，所以Romain也在现场用语音指示AI随机挑选5位现场观众，给他们的OpenAI账户里各充值500美金。作为本场活动的最后一个惊喜环节，Romain再一次向AI发出指令，给现场所有人的账户里各打了500美元。...PC版：https://www.cnbeta.com.tw/articles/soft/1394965.htm手机版：https://m.cnbeta.com.tw/view/1394965.htm

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人