ChatGPT能通过CFA考试吗？摩根大通研究人员试图找寻答案

ChatGPT能通过CFA考试吗？摩根大通研究人员试图找寻答案研究人员在长达11页的报告中写道，“基于预估的通过率和平均自报分数，我们得出的结论是ChatGPT可能无法在所有测试环境下通过CFA一级和二级考试。如果有提示，GPT-4将有较大机会通过CFA一级和二级考试。”CFA协会负责教育的董事总经理ChrisWiese承认，大语言模型将有能力正确回答一些考试问题。他说该公司还在考虑使用一种大语言模型技术来帮助CFA考生。近年来CFA考试的通过率有下降趋势，8月份一级考试通胀率平均为37%，远低于2018年43%的平均水平。常见错误CFA一级考试有180道单选题，二级考试包括案例研究和88道选择题。研究人员发现，无论使用何种类型的提示，这两个大语言模型的二级考试结果都不理想。一级考试中，ChatGPT和GPT-4在衍生品、另类投资、股权投资和伦理道德这几个部分得分最高。这两款聊天机器人在财务报告分析和投资组合管理方面表现都相对较差。二级考试中，与GPT-4相比，ChatGPT在另类投资、固定收益工具这两个部分表现更差，ChatGPT在投资组合管理、经济学相关的领域得分高于GPT-4。ChatGPT的大多数错误是基于知识性，而GPT-4最常犯的是计算错误。研究人员发现GPT-4比ChatGPT更容易出现推理错误。...PC版：https://www.cnbeta.com.tw/articles/soft/1394003.htm手机版：https://m.cnbeta.com.tw/view/1394003.htm

在Telegram中查看

相关推荐

ChatGPT通过美放射学委员会考试

ChatGPT通过美放射学委员会考试为评估ChatGPT在美国放射学委员会考试问题上的表现并探索其优势和局限性，多伦多大学研究人员首先测试了基于GPT-3.5的ChatGPT的表现。研究团队使用了150道选择题，这些选择题与加拿大皇家学院和美国放射学委员会考试的风格、内容和难度相当。这些问题不包括图像，分为低阶（知识回忆、基本理解）和高阶（应用、分析、综合）思维问题。高阶思维问题可进一步细分为影像学表现描述、临床管理、计算和分类、疾病关联。研究人员发现，基于GPT-3.5的ChatGPT的正确率为69%，接近70%的及格线。该模型在低阶思维问题上表现相对较好，正确率为84%，但回答高级思维问题时表现不佳，正确率仅为60%。而性能更优异的GPT-4的正确率为81%，且在高阶思维问题上的正确率为81%，远好于GPT-3.5。但GPT-4在低阶思维问题上的正确率仅为80%，答错了12道题，而GPT-3.5全部答对了这些题目，这引发了研究团队对GPT-4收集信息的可靠性的担忧。这两项研究都表明，ChatGPT会有提供不正确答案的倾向，如果仅仅依靠它获取信息，非常危险，因为人们可能意识不到其给出的答案是不准确的，这是它目前面临的最大的问题。...PC版：https://www.cnbeta.com.tw/articles/soft/1360277.htm手机版：https://m.cnbeta.com.tw/view/1360277.htm

研究人员将ChatGPT加入到Minecraft中，探索其在游戏领域的潜力

研究人员将ChatGPT加入到Minecraft中，探索其在游戏领域的潜力支撑ChatGPT的技术有可能做得更多，而不仅仅是聊天。芯片制造商Nvidia公司的人工智能研究员Linxi"Jim"Fan与一些同事合作，设计了一种方法，将强大的语言模型ChatGPT和越来越多的其他应用程序和服务背后的"大脑"放进积木式视频游戏Minecraft中。包括该公司机器学习主管和加州理工学院教授阿尼玛-阿南德库马尔在内的Nvidia团队创建了一个名为Voyager的Minecraft机器人，该机器人使用GPT-4来解决游戏中的问题。该语言模型产生了帮助探索游戏的目标，以及随着时间推移提高机器人游戏技能的代码。Voyager并不像人一样玩游戏，但它可以通过API直接读取游戏的状态。例如，它可能会看到库存中的一根鱼竿和附近的一条河，并使用GPT-4来建议做一些钓鱼来获得经验的目标。然后，它将使用这个目标，让GPT-4生成所需的代码，让角色实现这个目标。该项目最新颖的部分是GPT-4生成的代码，用于向Voyager添加行为。如果最初建议的代码不能完美运行，Voyager会尝试使用错误信息、游戏的反馈以及GPT-4生成的代码描述来完善它。——

研究人员称 GPT-4 通过图灵测试

研究人员称GPT-4通过图灵测试《生活科学》报道，OpenAI的GPT-4已经通过了图灵测试，这意味着该模型在对话中能够表现出类似人类的智能水平。图灵测试由计算机科学家阿兰·图灵提出，是评估人工智能是否能够与人类表现出相同智能的标准。此次测试结果显示，GPT-4的表现足够逼真，足以欺骗评判者，使其难以分辨其与人类的对话。关注频道@ZaiHuaPd频道爆料@ZaiHuabot

研究人员让人工智能帮助反证 P=NP 问题

研究人员让人工智能帮助反证P=NP问题一个来自国内的研究团队发表了一篇预印本，介绍了他们利用OpenAI的GPT-4来帮助反证问题不成立。该团队的方法相当于从之前的论文中提取论点，然后灌输给GPT-4，以促使其做出有用的反应。他们通过97轮提示，让GPT-4扮演“一位睿智的哲学家”、“一位精通概率论的数学家”，诱导GPT-4证明P事实上不等于NP。他们观察到，GPT-4演示了一些论据，从而得出P事实上不等于NP的结论。他们认为，这项工作表明大型语言模型不仅能吐回大量文本，还能“发现新的见解”，从而带来“科学发现”，他们将这一前景命名为“科学的LLM”。来源，频道：@kejiqu群组：@kejiquchat

研究称 ChatGPT 能够通过沃顿商学院的MBA期末考试

研究称ChatGPT能够通过沃顿商学院的MBA期末考试宾夕法尼亚大学沃顿商学院的一位教授进行的新研究（）发现，人工智能驱动的聊天机器人GPT-3能够通过该校工商管理硕士（MBA）项目的期末考试。ChristianTerwiesch教授撰写了研究论文《聊天机器人GPT3会获得沃顿商学院的MBA吗？》基于其在运营管理课程中的表现的预测，他说该机器人在考试中获得了B-和B之间的分数。Terwiesch写道，该机器人的分数显示了它“有显著的能力将一般高报酬的脑力工作者的一些技能自动化，特别是MBA毕业生所从事的工作中的脑力工作者，包括分析师、经理和顾问。”Terwiesch在1月17日发表的论文中写道：机器人在基本运营管理和流程分析问题上做得很好，包括那些基于案例研究的问题。他还说机器人的解释“非常好”。该机器人还“非常善于根据人类的提示修改其答案”，他总结道。——

ChatGPT几乎有能力通过美国医学执照考试

ChatGPT几乎有能力通过美国医学执照考试来自医疗保健创业公司AnsibleHealth的研究人员于2月9日在《PLOS数字健康》杂志上分享了他们的研究结果。他们发现ChatGPT能够在执照考试中取得"大约60%的通过门槛"。正如该网站所解释的，USMLE是美国医生获得医疗执照所必须参加的三步考试。除了测试未来医生的技能和医学知识外，该考试还评估他们的价值观和态度。在排除了基于图像的问题后，研究人员向ChatGPT提供了2022年6月USMLE考试中376个问题中的350个。在这三次考试中，ChatGPT的得分在52.4%和75%之间。在大多数年份，通过门槛约为60%。ChatGPT的得分也超过了PubMedGPT--一种专门针对生物医学文献进行训练的模型--其得分为50.8%。作者说。"达到这个众所周知的困难的专家考试的合格分数，并且在没有任何人类强化的情况下做到这一点，标志着临床人工智能成熟的一个值得注意的里程碑。"在这项研究发表后不久，各州医学委员会联合会和国家医学考试委员会，这两个USMLE的共同发起人，分享了他们自己的一份声明。他们指出，最近的两项研究使用了考试准备材料和练习题，而不是实际的USMLE考试题，因此，ChatGPT的成就只能带有一个星号。......需要注意的是，ChatGPT所使用的练习题并不能代表考生所经历的USMLE考试内容的全部深度和广度。例如，某些问题类型没有包括在研究中，如那些使用图片、心音和基于计算机的临床技能模拟。这意味着其他关键的考试结构在研究中没有得到完整的体现。"尽管目前没有足够的证据支持人工智能可以通过USMLE步骤考试的说法，但随着技术的发展，我们不会惊讶地看到人工智能模型大幅提高其性能，如果利用得当，这些工具可以对评估的构建方式和学生的学习方式产生积极影响。"...PC版：https://www.cnbeta.com.tw/articles/soft/1344437.htm手机版：https://m.cnbeta.com.tw/view/1344437.htm

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人