ChatGPT在临床决策中显示出"令人印象深刻"的准确性

ChatGPT在临床决策中显示出"令人印象深刻"的准确性这款基于扩展语言模型的人工智能聊天机器人在不同医疗领域的初级保健和急诊环境中都表现出了一致的性能。研究结果最近发表在《医疗互联网研究杂志》上。"我们的论文全面评估了通过ChatGPT提供的决策支持，从一开始与病人打交道到整个护理场景，从鉴别诊断一直到检测、诊断和管理，"论文通讯作者、麻省总医院创新和商业化副主席兼战略创新领导者、MESH孵化器执行主任MarcSucci博士说。"目前还没有真正的基准，但我们估计这种表现相当于医学院刚毕业的实习生或住院医师的水平。这告诉我们，一般来说，LLM有潜力成为医学实践的辅助工具，并以令人印象深刻的准确性支持临床决策。"人工智能技术的变化日新月异，正在改变包括医疗保健在内的许多行业。然而，人们还没有研究过LLM在临床护理中的全面辅助能力。在这项关于如何将LLMs用于临床建议和决策的跨专业综合研究中，Succi和他的团队测试了一个假设，即ChatGPT能够在与患者的整个临床接触过程中提出诊断建议，决定临床管理方案，并最终做出诊断。这项研究是通过将36个已发表的标准化临床案例的连续部分粘贴到ChatGPT中完成的。首先，要求该工具根据患者的初始信息（包括年龄、性别、症状以及是否急诊）提出一系列可能的诊断或鉴别诊断。然后，ChatGPT获得更多信息，并被要求做出处理决定和给出最终诊断--模拟真实病人就诊的整个过程。研究小组在结构化盲法过程中比较了ChatGPT在鉴别诊断、诊断检测、最终诊断和处理方面的准确性，对正确答案给予评分，并使用线性回归评估ChatGPT的表现与小插图人口统计信息之间的关系。研究人员发现，总体而言，ChatGPT的准确率约为72%，在最终诊断方面表现最佳，准确率为77%。在进行鉴别诊断时，它的准确率最低，只有60%。而在临床管理决策方面，如在得出正确诊断后决定用什么药物治疗病人，其准确率仅为68%。研究中其他值得注意的发现包括，ChatGPT的答案没有显示出性别偏见，其在初级和急诊护理中的整体表现稳定。"ChatGPT在鉴别诊断方面表现不佳，而鉴别诊断是医生必须弄清楚该怎么做的医学难题，"Succi说。"这一点很重要，因为它告诉我们医生在哪些方面才是真正的专家，并能带来最大的价值--在病人护理的早期阶段，几乎没有什么现成的信息，这时需要一份可能的诊断清单。"作者指出，在考虑将ChatGPT等工具整合到临床护理中之前，需要更多的基准研究和监管指导。下一步，Succi的团队将研究人工智能工具能否改善医院资源有限地区的病人护理和治疗效果。人工智能工具在医疗领域的出现具有开创性意义，有可能积极重塑医疗服务的连续性。麻省总医院布里格姆分院作为全美顶尖的综合学术医疗系统和最大的创新企业之一，在对新兴技术进行严格研究方面处于领先地位，为将人工智能负责任地融入医疗服务、劳动力支持和管理流程提供依据。MassGeneralBrigham首席信息官兼数字高级副总裁AdamLandman（医学博士、理学硕士、医学信息管理硕士、MHS）表示："MassGeneralBrigham认为LLM在帮助改善医疗服务和临床医生体验方面大有可为。我们目前正在评估LLM解决方案，以协助临床工作。"...PC版：https://www.cnbeta.com.tw/articles/soft/1379469.htm手机版：https://m.cnbeta.com.tw/view/1379469.htm

在Telegram中查看

相关推荐

新测试方法以近乎完美的准确性诊断冠状病毒感染

新测试方法以近乎完美的准确性诊断冠状病毒感染不仅如此，他们的方法有可能在暴露后几小时内发现感染--远远早于目前的COVID-19测试所能检测到的病毒--并且具有近乎完美的准确性。该团队在2月27日的《细胞报告方法》杂志上描述了他们的创新，目前仍处于早期开发阶段。大多数现有的COVID-19测试"依赖于相同的原理，即你已经积累了可检测的病毒物质，例如，在你的鼻子里，"研究的主要作者FrankZhang说，他作为纽约市Flatiron研究所计算生物学中心（CCB）的Flatiron研究员参与了这个项目。"当在感染时间窗口的早期，你还没有积累大量的病毒材料，或者你没有症状时，这就构成了一个挑战。"这项新技术反而是基于我们的身体在受到SARS-CoV-2（导致COVID-19的病毒）入侵时如何进行免疫反应。当攻击开始时，特定的基因会打开。这些基因的片段产生mRNA分子，指导蛋白质的构建。这些mRNA分子的特殊混合改变了产生的蛋白质类型，包括参与病毒对抗功能的蛋白质。这种新方法可以通过测量各种mRNA分子的相对丰度，有把握地确定人体何时对COVID-19病毒产生免疫反应。这项新研究是首次使用这种方法来诊断一种传染病。一张解释诊断COVID-19患者的新方法的信息图研究人员利用2020年对美国海军陆战队新兵的研究中，在参与者感染COVID-19之前和之后采集的血样来调整他们的方法。研究人员的计算框架确定了1000多个疾病相关的mRNA-变异比例变化。当使用真实世界的血液样本进行测试时，新方法产生了令人印象深刻的98.4%的准确率。这一点尤其令人印象深刻，因为这种方法对无症状的病人也很有效，对他们来说，快速抗原测试的准确率可能不到60%。现在是洛杉矶雪松-西奈医学中心助理教授的Zhang说："它的效果如此之好，真的令人惊讶。这是对传统PCR测试的一种有希望的替代和补充方法"。这种新方法还没有准备好进入应用，他和他的同事只测试了血液样本，而不是诊断COVID-19更常见和更方便的鼻腔样本。此外，他们还需要确保他们能够区分身体对COVID-19的反应和对其他病毒（如感冒）引起的感染的反应。研究人员说，不过他们很乐观，因为其他研究小组已经在只看哪些基因打开的测试上取得了进展。那些同样的测试可以很容易地加入新研究中开发的mRNA分析，从而产生更好的结果。"他们能做的任何事情，我们可能都能探索并联合起来，"包括在最初接触的几小时内捕捉到病例。...PC版：https://www.cnbeta.com.tw/articles/soft/1347221.htm手机版：https://m.cnbeta.com.tw/view/1347221.htm

欧盟数据保护委员会称 ChatGPT 的数据准确性仍未达标

欧盟数据保护委员会称ChatGPT的数据准确性仍未达标欧盟隐私监管机构的一个工作组称，OpenAI致力于减少其ChatGPT聊天机器人输出中的事实错误，但这不足以确保完全符合欧盟的数据规则。当地时间24日，该工作组在于其网站发布的一份报告中表示：“尽管为了遵守透明原则而采取的措施有利于避免对ChatGPT输出错误信息，但这些措施仍然不足以遵守数据准确性的原则。”在以意大利当局为首的国家监管机构对这项广泛使用的人工智能服务表示担忧后，欧盟数据保护委员会(EDPB)随后成立了“ChatGPT特别工作组”。——

机器学习模型可利用现有数据准确预测中风

机器学习模型可利用现有数据准确预测中风中风可能特别难以诊断，因为它的迹象和症状可能被其他疾病所模仿，如癫痫发作、偏头痛、精神障碍、药物和酒精中毒。此外，中风可以表现为非典型症状。大约25%的中风患者不会出现通常的语言问题、面部下垂和四肢无力，这使保健医生做出准确诊断的能力更加复杂。来自卡内基梅隆大学、佛罗里达国际大学和圣克拉拉大学的研究人员利用机器学习技术开发了一个自动筛选工具，以消除诊断中风的一些猜测。该研究的通讯作者RemaPadman说："机器学习方法已经被用来通过解释详细的数据，如临床记录和诊断成像结果，来帮助检测中风。但是当病人最初在医院急诊科被分流时，这样的信息可能并不容易得到，尤其是在农村和服务不足的社区。"为了开发他们的中风预测算法，研究人员使用了2012年至2014年期间佛罗里达州急诊医院收治的超过14.3万份个人病人记录。他们还纳入了美国人口普查局进行的美国社区调查的数据，其中包括年龄、性别、种族和现有医疗条件等人口统计数据。机器学习模型预测中风的准确率为84%。它也是高度敏感的，超过了现有的诊断模型，这些模型往往会错过高达30%的中风。该研究的主要作者MinChen说："现有模型的灵敏度不高，这让人担心它们会遗漏相当比例的中风患者。在医疗资源和临床人员短缺的医院，我们的算法可以补充目前的模型，帮助快速确定病人的优先次序，进行适当的干预。"该研究的结果表明，这种机器学习模型可以在通过影像诊断或实验室测试获得确认之前准确预测一个人已经或正在发生中风的可能性。"因为我们的模型不需要临床记录或诊断测试结果，它可能在处理症状较轻和不典型的走读中风患者时，对解决误诊难题特别有用，"该研究的共同作者XuanTan说。"它也可能在低容量或非卒中中心的急诊科有用，因为那里的服务提供者每天接触到的卒中有限，而且在农村地区，敏感的诊断工具有限。"但研究人员指出，他们的算法并不打算成为一个独立的模型；它应该与现有的中风诊断模型一起使用。研究人员建议将他们的中风预测算法纳入入院时可获得的自动化、计算机辅助的筛查工具。该研究发表在《医学互联网研究杂志》上。...PC版：https://www.cnbeta.com.tw/articles/soft/1355885.htm手机版：https://m.cnbeta.com.tw/view/1355885.htm

ChatGPT在提供高质量、有同情心的医疗建议方面优于医生

ChatGPT在提供高质量、有同情心的医疗建议方面优于医生这项研究比较了医生和ChatGPT对真实世界健康问题的书面答复。一个有执照的医疗专家小组在79%的情况下更喜欢ChatGPT的回答，并认为ChatGPT的回答质量更高、更有同情心。艾尔斯说："用人工智能改善医疗保健的机会是巨大的，"他也是加州大学旧金山分校医学院传染病和全球公共卫生处的创新副主任。"人工智能增强的护理是医学的未来。"在这项新的研究中，研究小组着手回答这个问题：ChatGPT能否准确地回应患者发送给医生的问题？如果是的话，人工智能模型可以被整合到卫生系统中，以改善医生对患者所发问题的回应，并减轻医生不断增加的负担。"ChatGPT可能能够通过医学执照考试，"研究报告的共同作者、UCSD奥特曼临床和转化研究所共同主任、UCSD医学院教授戴维-史密斯博士说，"但直接准确和富有同情心地回答病人的问题是一个不同的领域。""COVID-19大流行加速了虚拟医疗的采用，"研究报告的共同作者EricLeas博士补充说，他是高通研究所的成员，也是加州大学圣地亚哥分校赫伯特-沃特海姆公共卫生和人类长寿科学学院的助理教授。"虽然这使患者更容易获得护理，但医生却被大量寻求医疗建议的患者电子信息所困扰，这些信息导致了破纪录的医生职业倦怠。"为了获得大量不同的医疗问题和医生回答的样本，并且不包含可识别的个人信息，该团队转向了社交媒体，在那里有数百万的病人公开发布医疗问题，而医生会做出回应：Reddit的AskDocs。r/AskDocs是一个拥有约452,000名成员的子reddit，他们发布医疗问题，并由经过验证的医疗专业人士提交答案。虽然任何人都可以对问题作出回应，但版主会验证医疗保健专业人士的证书，而回应会显示回应者的证书水平。其结果是一个庞大而多样的病人医疗问题和来自有执照的医疗专业人士的相应答案。虽然有些人可能怀疑社交媒体上的问答交流是否是一个公平的测试，但团队成员指出，这些交流反映了他们的临床经验。该团队从AskDocs中随机抽取了195个交流，其中有一位经过验证的医生回答了一个公共问题。该团队向ChatGPT提供了原始问题，并要求它编写一份答复。一个由三名持证医疗专业人士组成的小组对每个问题和相应的回答进行了评估，并对回答是来自医生还是ChatGPT进行了盲审。他们根据信息质量和同情心来比较答复，并指出他们更喜欢哪一个。医疗保健专业人员评估小组在79%的情况下喜欢ChatGPT的回答而不是医生的回答。圣地亚哥HumanLongevity公司的执业护士、研究报告的合著者JessicaKelley说："ChatGPT信息的回应细微而准确，往往比医生的回应更能解决病人的问题。"此外，ChatGPT的回答在质量上的评价明显高于医生的回答：ChatGPT的回答质量好或非常好是医生的3.6倍（医生22.1%，ChatGPT78.5%）。这些回答也更有同情心：ChatGPT的同情或非常同情的回答比医生高9.8倍（医生4.6%，ChatGPT45.1%）。加州大学旧金山分校医学院副临床教授、研究报告作者之一亚伦-古德曼博士补充说："我从未想象过会这么说，但ChatGPT是我想给我的收件箱开的处方。该工具将改变我支持病人的方式"。"虽然我们的研究将ChatGPT与医生对立起来，但最终的解决方案并不是将你的医生完全扔掉，"布林茅尔学院计算机科学助理教授、研究报告的共同作者亚当-波利亚克博士说。"相反，医生利用ChatGPT是更好的、有同情心的护理的答案。""我们的研究是第一批显示人工智能助手如何潜在地解决现实世界的医疗保健提供问题的研究，"加州大学圣地亚哥分校健康部首席医疗官和首席数字官克里斯托弗-隆赫斯特博士说。"这些结果表明，像ChatGPT这样的工具可以有效地起草高质量、个性化的医疗建议，供临床医生审查，我们正在UCSDHealth开始这一过程。"医生-生物信息学家、加州大学圣地亚哥分校奥特曼临床和转化研究所联合主任、加州大学圣地亚哥分校医学院教授、研究报告共同作者MikeHogarth博士补充说："重要的是，将人工智能助手整合到医疗保健信息中，要在随机对照试验的背景下进行，以判断人工智能助手的使用对医生和患者的结果有何影响。"除了改善工作流程，对人工智能助手信息传递的投资可能会影响病人的健康和医生的表现。约翰霍普金斯大学计算机科学的JohnCMalone副教授和研究报告的共同作者MarkDredze博士指出："我们可以利用这些技术来训练医生以病人为中心的沟通，消除经常通过信息传递寻求医疗保健的少数民族人口所遭受的健康差异，建立新的医疗安全系统，并通过提供更高质量和更有效的护理来协助医生。"...PC版：https://www.cnbeta.com.tw/articles/soft/1357293.htm手机版：https://m.cnbeta.com.tw/view/1357293.htm

免疫增强型化疗药物在临床试验中显示出前景

免疫增强型化疗药物在临床试验中显示出前景在以前的研究中，科学家们发现有一群细胞似乎对这种不必要的抵抗负责，他们将其命名为骨髓源性抑制细胞（MDSCs）。在此后的几年里，一种名为全反式维甲酸（ATRA）的化疗药物被开发出来，以MDSCs为目标，目的是防止它们干扰免疫反应。在这项新研究中，科罗拉多大学癌症中心的科学家们进行了一项Ib/II期临床试验，测试ATRA与一种名为pembrolizumab（品牌名称Keytruda）的免疫治疗药物的结合。该试验涉及24名IV期黑色素瘤患者，其中一些人同时接受两种药物治疗，一些人只单独接受pembrolizumab。在接受两种药物治疗的患者中，71%对治疗反应良好，其中50%出现完全反应，80%在治疗后一年内存活。相比之下，单独使用免疫疗法的反应率约为40%。当科学家们仔细检查时，他们发现循环MDSCs的水平被有效降低了。该试验还对毒性进行了测试，发现ATRA组的副作用大多较轻，包括最初用药时的头痛、疲劳和恶心。在这些积极的结果之后，II期临床试验已经在其他类型的免疫疗法已经失败的癌症患者身上展开。临床试验的首席科学家MartinMcCarter说："我们表明它是安全和有效的，所以向这个方向发展是有意义的。这确实是现在最需要帮助的病人群体。如果肿瘤对免疫疗法没有反应，那么之后对任何东西产生反应的机会都非常小。我们正试图找到操纵肿瘤微环境的方法，以允许更好的免疫反应"。该研究发表在《临床癌症研究》杂志上。...PC版：https://www.cnbeta.com.tw/articles/soft/1335615.htm手机版：https://m.cnbeta.com.tw/view/1335615.htm

机器人解决验证码的速度、准确性都已优于人类

机器人解决验证码的速度、准确性都已优于人类近二十年来，验证码被广泛用作防止机器人的手段，验证码的复杂性和多样性也在不断发展，这种军备竞赛使人类和机器都越来越难以处理验证码。这项研究评估了不同人群的验证码解决性能，其中1400名参与者总共解决了14000个验证码，包括图像分类、滑块、扭曲文本、纠正方位等主流防御方案，结果发现人类的解决速度和准确率都已弱于机器人。投稿：@ZaiHuaBot频道：@TestFlightCN

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人