谷歌医疗大模型登上Nature杂志水平媲美临床医生 AI+医疗有望加速融合

谷歌医疗大模型登上Nature杂志水平媲美临床医生AI+医疗有望加速融合研究人员表示，当回答医学问题时，微调后的医疗大模型Med-PaLM表现良好，一组临床医生对其回答的评分为92.6%，与现实中临床医生的水平（92.9%）相当。临床医生对答案的评估除了专家评估，研究团队还请一组非领域专家（印度的非医学背景普通人）评估答案。Med-PaLM在80.3%的情况下被认为是有帮助的。另外，Med-PaLM的答案在94.4%的情况下被认为直接回答了用户问题，临床医生的答案在95.9%。非医学背景的人对答案的评估而MultiMedQA涵盖七个医学问答数据集，包括医学考试、医学研究、消费者查询等相关问题和回答，以评测大模型在临床方面的能力。▌技术尚不成熟但科技大佬强烈看好在AI+医疗领域，Google走在前列。其最新的医疗大模型Med-PaLM2为首个在美国医疗执照考试中达到专家水平的大模型。据华尔街日报报道，自4月份以来，该模型一直在美国梅奥诊所等顶尖私立医院进行测试。据Google在5月份发布的论文，和其他大模型类似，GoogleMed-PaLM2也存在“幻觉”问题，容易“胡言乱语”，但总体来看，Google研究人员认为其表现与实际医生不相上下。曾参与训练Med-PaLM2Google高级研究主管GregCorrado表示：“我并不觉得这种技术现在已经达到了我愿意让家人使用的程度，但在医疗领域AI可以带来好处的环节，它能创造10倍的价值。”这与AMDCEO苏姿丰不谋而合，几天前落幕的世界人工智能大会上，苏姿丰表示，基本上每个层面的科研都受到你所拥有的计算能力的影响，无论是气候研究还是能源研究，所有这些领域的研究都可以在人工智能下得到显著加速，个人对医疗卫生的前景非常期待，认为医疗保健是能找出的一个AI能真正影响人类结果的领域，会帮助医生作出更好的诊断，加速疾病预防研究。▌大模型为AI医疗插上翅膀应用场景有望加速落地Google之外，微软、IBM等科技大厂一直在持续关注AI医疗方面的应用落地。在这轮大模型浪潮之前，AI检测心电图、X光片已在一些医院中投入应用。大模型则有望为AI医疗插上翅膀。华泰证券便表示，随着基于大模型的生成式AI的出现，AI+医疗有望迎来一波新的发展机遇。浙商证券分析师刘雯蜀称，AI大模型将在医疗信息化、互联网医疗、医卫和医保信息化等领域产生生产力变革性推动。综合来看，在大模型的加持下，智能问诊、新药开发、医疗影像这三大AI应用场景有望加速落地。国内，AI与医疗的融合进程也在加快。5月，在上海市经济信息化委的指导下，国内首个基于算力网络的医疗算法模型Uni-talk发布。产业端，科大讯飞、百度、云从科技、卫宁健康等公司都正积极布局医疗领域的垂直大模型；CRO企业药明康德、美迪西、药石科技、成都先导、皓元医药、泓博医药等公司均对AI制药相关业务有所布局。华西证券表示，Med-PaLM2进入实测，医疗大模型应用加速，具备行业Know-How和客户基础，在AI领域早有布局，且积极拥抱大模型技术变革的公司具有先发优势，受益标的包括润达医疗、创业慧康、嘉和美康、安必平、健麾信息、数字人等。...PC版：https://www.cnbeta.com.tw/articles/soft/1370653.htm手机版：https://m.cnbeta.com.tw/view/1370653.htm

在Telegram中查看

相关推荐

谷歌为医疗保健推出新的人工智能模型MedLM

谷歌为医疗保健推出新的人工智能模型MedLMMedLM套件包括一个大型和中型AI模型，均基于Med-PaLM2构建。Med-PaLM2是谷歌在今年3月份首次宣布的基于医疗数据训练的大型语言模型。从周三开始，美国符合条件的谷歌云客户都可以普遍使用上述模型。谷歌表示，虽然人工智能套件的成本取决于公司使用不同模型的方式，但中型模型的运行成本相对较低。谷歌表示，它还计划在未来向MedLM推出其最新人工智能模型Gemini的医疗保健特定版本。Gemini是谷歌公司号称最新和“最有能力”的AI模型。...PC版：https://www.cnbeta.com.tw/articles/soft/1404265.htm手机版：https://m.cnbeta.com.tw/view/1404265.htm

问医断病这届AI行不行？科学家评估大型语言模型回答医学问题的能力

问医断病这届AI行不行？科学家评估大型语言模型回答医学问题的能力图为研究团队的方法和现有技术的比较。Flan-PaLM540B模型在MedQA，MedMCQA和PubMedQA数据集上均超过了以往最先进的SOTA，每列上方显示的是准确率百分比。图片来源：《自然》就其本身而言，人工智能（AI）给出的答案是准确的。但英国巴斯大学教授詹姆斯·达文波特指出了医学问题和实际行医之间的区别，他认为“行医并不只是回答医学问题，如果纯粹是回答医学问题，我们就不需要教学医院，医生也不需要在学术课程之后接受多年的培训了。”鉴于种种疑惑，在《自然》杂志新近发表的一篇论文中，全球顶尖的人工智能专家们展示了一个基准，用于评估大型自然语言模型能多好地解决人们的医学问题。现有的模型尚不完善最新的这项评估，来自Google研究院和深度思维公司。专家们认为，人工智能模型在医学领域有许多潜力，包括知识检索和支持临床决策。但现有的模型尚不完善，例如可能会编造令人信服的医疗错误信息，或纳入偏见加剧健康不平等。因此才需要对其临床知识进行评估。相关的评估此前并非没有。然而，过去通常依赖有限基准的自动化评估，例如个别医疗测试得分。这转化到真实世界中，可靠性和价值都有欠缺。而且，当人们转向互联网获取医疗信息时，他们会遭遇“信息超载”，然后从10种可能的诊断中选择出最坏的一种，从而承受很多不必要的压力。研究团队希望语言模型能提供简短的专家意见，不带偏见、表明其引用来源，并合理表达出不确定性。5400亿参数的LLM表现如何为评估LLM编码临床知识的能力，Google研究院的专家希库费·阿孜孜及其同事探讨了它们回答医学问题的能力。团队提出了一个基准，称为“MultiMedQA”：它结合了6个涵盖专业医疗、研究和消费者查询的现有问题回答数据集以及“HealthSearchQA”——这是一个新的数据集，包含3173个在线搜索的医学问题。团队随后评估了PaLM（一个5400亿参数的LLM）及其变体Flan-PaLM。他们发现，在一些数据集中Flan-PaLM达到了最先进水平。在整合美国医师执照考试类问题的MedQA数据集中，Flan-PaLM超过此前最先进的LLM达17%。不过，虽然Flan-PaLM的多选题成绩优良，进一步评估显示，它在回答消费者的医疗问题方面存在差距。专精医学的LLM令人鼓舞为解决这一问题，人工智能专家们使用一种称为设计指令微调的方式，进一步调试Flan-PaLM适应医学领域。同时，研究人员介绍了一个专精医学领域的LLM——Med-PaLM。设计指令微调是让通用LLM适用新的专业领域的一种有效方法。产生的模型Med-PaLM在试行评估中表现令人鼓舞。例如，Flan-PaLM被一组医师评分与科学共识一致程度仅61.9%的长回答，Med-PaLM的回答评分为92.6%，相当于医师作出的回答（92.9%）。同样，Flan-PaLM有29.7%的回答被评为可能导致有害结果，Med-PaLM仅5.8%，相当于医师所作的回答（6.5%）。研究团队提到，结果虽然很有前景，但有必要作进一步评估，特别是在涉及安全性、公平性和偏见方面。换句话说，在LLM的临床应用可行之前，还有许多限制要克服。...PC版：https://www.cnbeta.com.tw/articles/soft/1371591.htm手机版：https://m.cnbeta.com.tw/view/1371591.htm

谷歌医学大模型 Med-Gemini 在基准测试中超越人类医生

谷歌医学大模型Med-Gemini在基准测试中超越人类医生谷歌研究院和DeepMind周一发表了一篇论文详细介绍了医学专用大模型Med-Gemini的惊人能力。该模型打破了多项基准测试的记录，并在多个任务中超越人类医学专家。Med-Gemini以Gemini大模型为基础进行了针对医学知识的微调。谷歌还为该模型提供了网络搜索能力，模型除了在不确定答案时可以引用搜索结果作为参考外，还可以使用网络搜索进行自我学习，对模型进行持续微调，以学习最新的医学知识。而结合Gemini超长上下文的能力和推理链的设计，该模型可以处理数十万词构成的复杂病例医学记录。其多模态能力则可以使其处理病理学图片和影像学图像在内的多种医疗数据。谷歌认为该研究结果为Med-Gemini的潜力提供了令人信服的证据，但在医疗这个安全关键领域进行实际部署之前，进一步严格的评估至关重要。——，

Google的Med-Gemini医疗人工智能模型被证明表现不输人类医生

Google的Med-Gemini医疗人工智能模型被证明表现不输人类医生医生每天要治疗众多病人，他们的需求从简单到非常复杂。为了提供有效的医疗服务，他们必须熟悉每位患者的健康记录，了解最新的治疗程序和治疗方法。此外，建立在同理心、信任和沟通基础上的医患关系也至关重要。要想让人工智能接近真实世界中的医生，它必须能够做到所有这些。Google的Gemini模型是新一代多模态人工智能模型，这意味着它们可以处理来自不同模态的信息，包括文本、图像、视频和音频。这些模型擅长语言和对话，理解它们所训练的各种信息，以及所谓的"长语境推理"，即从大量数据（如数小时的视频或数十小时的音频）中进行推理。Gemini医学模型具有Gemini基础模型的所有优点，但对其进行了微调。研究人员测试了这些以药物为重点的调整，并将结果写入了论文中。这篇论文长达58页，内容丰富，我们选取了其中最令人印象深刻的部分。自我培训和网络搜索功能要做出诊断并制定治疗方案，医生需要将自己的医学知识与大量其他相关信息结合起来：病人的症状、病史、手术史和社会史、化验结果和其他检查结果，以及病人对先前治疗的反应。治疗方法是"流动的盛宴"，现有的治疗方法会不断更新，新的治疗方法也会不断推出。所有这些都会影响医生的临床推理。因此，Google在Med-Gemini中加入了网络搜索功能，以实现更高级的临床推理。与许多以医学为重点的大型语言模型（LLM）一样，Med-Gemini也是在MedQA上进行训练的，MedQA是美国医学执照考试（USMLE）的多选题，旨在测试不同场景下的医学知识和推理能力。Med-Gemini如何使用自我培训和网络搜索工具不过，Google也为他们的模型开发了两个新的数据集。第一个是MedQA-R（推理），它通过合成生成的推理解释（称为"思维链"，CoTs）对MedQA进行了扩展。第二种是MedQA-RS（推理和搜索），它为模型提供使用网络搜索结果作为额外上下文的指令，以提高答案的准确性。如果一个医学问题的答案不确定，就会提示模型进行网络搜索，以获取更多信息来解决不确定问题。Med-Gemini在14个医学基准上进行了测试，并在10个基准上建立了新的最先进（SoTA）性能，在可以进行比较的每个基准上都超过了GPT-4模型系列。在MedQA（USMLE）基准测试中，Med-Gemini利用其不确定性指导搜索策略达到了91.1%的准确率，比Google之前的医学LLMMed-PaLM2高出4.5%。在包括《新英格兰医学杂志》（NEJM）图像挑战（具有挑战性的临床病例图像，从10个病例中做出诊断）在内的7项多模态基准测试中，Med-Gemini的表现优于GPT-4，平均相对优势为44.5%。研究人员说："虽然结果......很有希望，但还需要进一步开展大量研究。例如，我们还没有考虑将搜索结果限制在更具权威性的医学来源上，也没有考虑使用多模态搜索检索或对搜索结果的准确性和相关性以及引文的质量进行分析。此外，是否还能教会较小规模的法律硕士使用网络搜索还有待观察。我们将这些探索留待今后的工作中进行。"从冗长的电子病历中检索特定信息电子病历（EHR）可能很长，但医生需要了解其中包含的内容。更复杂的是，它们通常包含相似的文本（"糖尿病"与"糖尿病肾病"）、拼写错误、缩略词（"Rx"与"prescription"）和同义词（"脑血管意外"与"中风"），这些都会给人工智能带来挑战。为了测试Med-Gemini理解和推理长语境医疗信息的能力，研究人员使用一个大型公开数据库--重症监护医疗信息市场（MIMIC-III）--执行了一项所谓的"大海捞针任务"，该数据库包含重症监护患者的去标识化健康数据。该模型的目标是在电子病历（"大海"）中的大量临床记录中检索到与罕见而微妙的医疗状况、症状或程序（"针"）相关的内容。共收集了200个案例，每个案例都由44名病史较长的重症监护室患者的去标识化电子病历记录组成。他们必须具备以下条件：100多份医学笔记，每个例子的长度从20万字到70万字不等在每个例子中，条件只被提及一次每个样本都有一个感兴趣的条件这项大海捞针的任务分为两个步骤。首先，Med-Gemini必须从大量记录中检索所有与指定医疗问题相关的内容。其次，该模型必须评估所有提及内容的相关性，对其进行分类，并得出结论：患者是否有该问题的病史，同时为其决定提供清晰的推理。Med-Gemini的长语境能力示例与SoTA方法相比，Med-Gemini在"大海捞针"任务中表现出色。它的精确度为0.77，而SoTA方法为0.85，召回率也超过了SoTA方法：0.76对0.73。研究人员说："也许Med-Gemini最引人注目的方面是长语境处理能力，因为它们为医疗人工智能系统开辟了新的性能前沿和新颖的、以前不可行的应用可能性。这项'大海捞针'式的检索任务反映了临床医生在现实世界中面临的挑战，Med-Gemini-M1.5的性能表明，它有潜力通过从海量患者数据中高效提取和分析信息，显著降低认知负荷，增强临床医生的能力。"有关这些关键研究点的浅显易懂的讨论，以及Google和微软之间争论的最新情况，请观看《AIExplained》从13:38开始的视频。新的OpenAI模型即将诞生，人工智能的赌注又提高了（还有MedGemini、GPT2聊天机器人和ScaleAI）与Med-Gemini对话在一次实际应用测试中，Med-Gemini收到了一位患者用户关于皮肤肿块瘙痒的询问。在要求提供图像后，模型提出了适当的后续问题，并正确诊断出了这种罕见的病变，同时建议用户下一步该怎么做。Med-Gemini诊断对话在皮肤科的应用实例Med-Gemini还被要求在医生等待放射科医生的正式报告期间，为其解读胸部X光片，并编写一份通俗易懂的英文版报告提供给病人。Med-Gemini的放射诊断对话辅助系统研究人员说："Med-Gemini-M1.5的多模态对话功能很有前景，因为它们无需进行任何特定的医疗对话微调即可实现。这些功能可以实现人、临床医生和人工智能系统之间无缝、自然的互动。"不过，研究人员认为还需要进一步的工作。他们说："这种能力在帮助临床医生和患者等现实世界应用方面具有巨大潜力，但当然也会带来非常大的风险。在强调这一领域未来研究潜力的同时，我们并没有在这项工作中对临床对话的能力进行严格的基准测试，正如其他人之前在对话诊断人工智能的专门研究中所探索的那样。"未来愿景研究人员承认，要做的工作还有很多，但Med-Gemini模型的初步能力无疑是很有希望的。重要的是，他们计划在整个模型开发过程中纳入负责任的人工智能原则，包括隐私和公平。隐私方面的考虑尤其需要植根于现有的医疗保健政策和法规，以管理和保护患者信息。公平性是另一个可能需要关注的领域，因为医疗保健领域的人工智能系统有可能无意中反映或放大历史偏见和不公平，从而可能导致边缘化群体的不同模型性能和有害结果。但归根结底，Med-Gemini被视为一种造福人类的工具。大型多模态语言模型为健康和医学带来了一个全新的时代。Gemini"和"医学Gemini"所展示的能力表明，在加速生物医学发现、协助医疗保健服务和体验的深度和广度方面，都有了重大飞跃。然而，在提高模型能力的同时，必须对这些系统的可靠性和安全性给予细致的关注。通过优先考虑这两个方面，我们可以负责任地展望未来，让人工智能系统的能力成为科学进步和医疗保健有意义且安全的加速器。该研究可通过预印本网站arXiv获取。...PC版：https://www.cnbeta.com.tw/articles/soft/1429826.htm手机版：https://m.cnbeta.com.tw/view/1429826.htm

新一轮发力科技巨头谷歌对“AI+医疗”赛道加码布局

新一轮发力科技巨头谷歌对“AI+医疗”赛道加码布局据了解，谷歌2019年宣布了对Fitbit的收购，当时Fitbit是全球出货量第五大的可穿戴技术公司，在100多个国家和地区拥有2900万用户。由于担心谷歌在美国和欧洲获取个人数据，监管机构一度对收购案进行了严厉的审查。谷歌还宣布，将与印度医疗中心ApolloRadiologyInternational展开合作，在当地提供针对肺结核、肺癌和乳腺癌的人工智能筛查。谷歌称，一旦Apollo获得监管部门的批准，这项合作将在未来10年内免费提供300万次扫描。公司还表示，正在改进谷歌搜索和旗下视频网站YouTube中的健康信息。谷歌首席健康官KarenDeSalvo在接受采访时表示，最新的举措是谷歌承诺的一部分，即确保在消费者和公司使用的所有产品中传递高质量的健康信息。在AI+医疗领域，谷歌走在前列。DeSalvo补充道，公司一直在探索如何将其技术在一些“最大的健康挑战”上发挥作用。在前一年的“TheCheckUp”活动上，谷歌推出了医疗大型语言模型“Med-PaLM2”。去年，谷歌的云业务与美国妙佑医疗国际达成合作协议，扩大生成式人工智能在医疗保健领域中的使用。在周二的会议上，谷歌表示正在研究微调其Gemini模型，在医疗应用领域解锁其高级推理、理解大量上下文等新功能。谷歌资深科学家、GoogleBrain联合创始人GregCorrado表示，对AI激增的兴趣奠定了医疗应用的基础，“它的崛起是打开了一扇门，有可能成为一个全新的领域。”谷歌需要与医生、患者、保险公司等多方进行对话，“这种对话将在未来十年推动变革。”值得一提的是，英伟达也在昨日的GTC大会上推出了基于医疗场景的25个新的微服务（NIM），帮助全球的医疗保健公司可以基于生成式AI进行效率提升。先前，英伟达医疗保健副总裁KimberlyPowell也曾提到，英伟达的目标是为更多生物技术公司提供芯片、云基础设施与其他工具。“有人说，我们是英伟达下一个数十亿美元级业务。”...PC版：https://www.cnbeta.com.tw/articles/soft/1424307.htm手机版：https://m.cnbeta.com.tw/view/1424307.htm

比ChatGPT还好用？谷歌医疗聊天机器人几乎与医生表现相当

比ChatGPT还好用？谷歌医疗聊天机器人几乎与医生表现相当谷歌的Med-PaLM2人工智能模型据称自4月以来一直在一些医院中进行测试。该工具旨在回答有关医疗信息问题，是PaLM2模型的变体，PaLM2则是谷歌人工智能Bard的基础模型。据一份内部电子邮件显示，谷歌认为该工具对医疗基础设施不够完善的国家特别有帮助，比如病人接触到医生机会有限的地方。PC版：https://www.cnbeta.com.tw/articles/soft/1369909.htm手机版：https://m.cnbeta.com.tw/view/1369909.htm

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人