李飞飞等用不到50美元训练出媲美DeepseekR1的AI推理模型

OpenAI推出“满血版”推理模型o1和ChatGPT Pro

OpenAI推出“满血版”推理模型o1和ChatGPT Pro OpenAI 为期12天的活动开幕。在第一天的活动上，OpenAI 创始人萨姆·奥尔特曼表示，今天发布的是“满血版”推理模型 o1 和 ChatGPT Pro（每月订阅费200美元）。据介绍，o1 是世界上最智能的模型。比 o1-preview 更智能、更快速、功能更多（例如多模态）。现已在 ChatGPT 中上线，即将在 API 中推出。新推出的 ChatGPT Pro 将能够充分利用模型和工具，包括无限接入 OpenAI o1 和一个仅仅有 Pro 版本的 o1。财联社、OpenAI-电报频道- #娟姐新闻:@juanjienews

谷歌发布首个人工智能推理模型

谷歌发布首个人工智能推理模型当地时间12月19日，谷歌发布实验性的“Gemini 2.0 Flash Thinking”模型，这是谷歌首个AI推理模型。该模型能明确展现自己的思考过程，来解决复杂的问题，推理能力更强。该模型目前已在Google AI Studio和Vertex AI平台上线。谷歌表示，这只是推理之旅的第一步，未来这些推理能力可能会集成到Gemini 2.0系列主要模型中。财联社、Techcrunch-电报频道- #娟姐新闻:@juanjienews

阶跃星辰发布推理模型：要将推理能力融入更多交互形态的大模型

阶跃星辰发布推理模型：要将推理能力融入更多交互形态的大模型 1月16日，国内大模型“六小虎”之一的阶跃星辰发布自研推理模型Step Reasoner mini。在AIME和Math等数学基准测试上与OpenAI o1-mini水平相当。据介绍，Step Reasoner mini是Step系列模型家族的首个推理模型，擅长主动进行规划、尝试和反思，能通过慢思考和反复验证的逻辑机制，提供准确可靠的回…… - 电报频道 - #娟姐新闻: @juanjienews

月之暗面发布新一代数学推理模型

月之暗面发布新一代数学推理模型月之暗面旗下Kimi发布新一代数学推理模型k0-math。基准测试显示，Kimi k0-math的数学能力可对标OpenAI o1系列可公开使用的两个模型：o1-mini和o1-preview。在中考、高考、考研以及包含入门竞赛题的MATH等4个数学基准测试中，k0-math初代模型成绩超过o1-mini和o1-preview模型。在两个难度更大的竞赛级别的数学题库OMNI-MATH和AIME基准测试中，k0-math初代模型的表现分别达到了o1-mini最高成绩的90%和83%。k0-math模型和Kimi探索版，未来几周将会分批上线Kimi网页版和Kimi智能助手APP。界面新闻-电报频道- #娟姐新闻:@juanjienews

阿里云通义开源推理大模型QwQ，推理水平比肩OpenAI o1

阿里云通义开源推理大模型QwQ，推理水平比肩OpenAI o1 11月28日，阿里云通义团队发布全新人工智能推理模型QwQ-32B-Preview，并同步开源。评测数据显示，预览版本的QwQ，已展现出研究生水平的科学推理能力，在数学和编程方面表现尤为出色，整体推理水平比肩OpenAI o1。QwQ (Qwen with Questions)是通义千问Qwen大模型最新推出的实验性研究模型，也是阿里云首个开源的人工智能推理模型。阿里云通义千问团队研究发现，当模型有足够的时间思考、质疑和反思时，其对数学和编程的理解就会深化。基于此，QwQ取得了解决复杂问题的突破性进展。阿里巴巴-电报频道- #娟姐新闻:@juanjienews

国家超算互联网平台接入阿里千问大模型