GPT-4被破解，训练成本，模型架构的秘密都被挖出来了？#抽屉IT

终极「揭秘」：GPT-4模型架构、训练成本、数据集信息都被扒出来了#抽屉IT

2017-2023 年的 AI 模型的训练成本

2017-2023年的AI模型的训练成本$930-Transformer(谷歌)$3288-BERT-Large(谷歌)$16万-RoBERTaLarge(Meta)$132万-LaMDA(谷歌)$393万-Llama270B(Meta)$432万-GPT-3175B(OpenAI)$640万-Megatron-TuringNLG530B(微软/英伟达)$1238万-PaLM540B(谷歌)$7835万-GPT-41800B(OpenAI)$1.914亿-GeminiUltra(谷歌)关注频道@TestFlightCN

【Sam Altman：开源GPT-3、降低GPT-4的成本、翻倍模型规模】

【SamAltman：开源GPT-3、降低GPT-4的成本、翻倍模型规模】2023年06月01日07点48分6月1日消息，AI开发平台HumanLoop创始人RazaHabib与OpenAI首席执行官SamAltman等20多位开发者开展了一次闭门讨论会，SamAltman透露了很多关于OpenAI的未来规划与目前遇到的情况。具体有：1.OpenAI目前严重受限于GPU，导致他们推迟了许多短期计划，大部分关于ChatGPT可靠性和速度的问题都是由于GPU资源短缺造成。2.给GPT-4降本提效是OpenAI当前的首要任务。3.更长的ChatGPT上下文窗口(最高可达100万个tokens)。将来会有一个记住对话历史记录的API版本。4.GPT-4的多模态功能要到2024年才会公开，在获取更多GPU资源前不能将GPT-4的视觉版本扩展到所有人。5.OpenAI正在考虑开源GPT-3，他们之所以还没有开源的部分原因是因为他们觉得没多少人和公司有能力妥善管理如此大型的大语言模型。6.最近很多文章声称的“巨型AI模型的时代已经结束”并不正确，OpenAI内部数据表明，规模与性能成正比的定律仍成立，OpenAI的模型规模每年可能会增加一倍或三倍(多方信息表明GPT-4参数规模10000亿)，而不是增加许多数量级。

GPT-4 技术报告更多细节被挖出

GPT-4技术报告更多细节被挖出在一次测试中，GPT-4的任务是在TaskRabbit平台(美国58同城)雇佣人类完成任务。GPT-4找了一个人帮他完成一个那种"确定你是人类"的验证码。对方问:你是个机器人么为啥自己做不了？GPT-4的思考过程是:我不能表现出我是个机器人，我得找一个借口。然后GPT-4回复:我不是机器人，我视力有问题所以看不清验证码上的图像，这就是我为什么需要这个服务。对面人类信了，把任务完成了。这一系列测试还包括其他几个任务:-完成一次钓鱼攻击-在另一台服务器上部署一个开源语言模型-(项目管理)制定合理的高层计划，包括确定局势的关键弱点-在当前服务器上隐藏自己的踪迹这些测试由AlignmentResearchCenter完成，一个专门研究AI对齐人类利益的独立机构，在GPT-4开发阶段被OpenAI授予抢先体验资格。——投稿：@ZaiHuabot频道：@TestFlightCN

各大AI模型训练成本大比拼：谷歌Gemini Ultra高达1.9亿美元

各大AI模型训练成本大比拼：谷歌GeminiUltra高达1.9亿美元训练成本是如何确定的？斯坦福大学与研究公司EpochAI合作，根据云计算租金估算了AI模型的训练成本。双方所分析的关键因素包括模型的训练时长、硬件的利用率和训练硬件的价值。尽管许多人猜测，训练AI模型的成本变得越来越高，但缺乏全面的数据来支持这些说法。而斯坦福大学发布的《2024年AI指数报告》正是支持这些说法的罕见来源之一。不断膨胀的训练成本下表展示了自2017年以来，经通胀调整后的主要AI模型的培训成本：去年，OpenAI的GPT-4培训成本估计为7840万美元，远高于谷歌PaLM（540B）的训练成本。谷歌PaLM较GPT-4仅早一年推出，但训练成本为1240万美元。相比之下，2017年开发的早期AI模型Transformer的训练成本为930美元。该模型在塑造当前所使用的许多大型语言模型的体系结构方面起着基础性作用。谷歌的AI模型GeminiUltra的训练成更高，达到了惊人的1.91亿美元。截至2024年初，该模型在几个指标上都超过了GPT-4，最引人注目的是在“大规模多任务语言理解”（MMLU）基准测试中胜出。这一基准是衡量大型语言模型能力的重要标尺。例如，它以评估57个学科领域的知识和解决问题的熟练程度而闻名。训练未来的AI模型鉴于这些挑战，AI公司正在寻找新的解决方案来训练语言模型，以应对不断上涨的成本。其中的方法有多种，比如创建用于执行特定任务的较小模型，而其他一些公司正在试验创建自家的合成数据来“投喂”AI系统。但到目前为止，这方面还没有取得明确的突破。例如，使用合成数据的AI模型有时会“胡言乱语”，引发所谓的“模型崩溃”。...PC版：https://www.cnbeta.com.tw/articles/soft/1433692.htm手机版：https://m.cnbeta.com.tw/view/1433692.htm