Med-PaLM2 在医疗方面已经是专家级了。

Med-PaLM2 在医疗方面已经是专家级了。 专家级的医疗建议将是普惠的,人类之光。 Shek Azizi: We are so thrilled to announce Med-PaLM 2, our new SOTA medical LLM! Med-PaLM 2 reaches an accuracy of over 85% on USMLE MedQA, going from "passing score" to "expert performance"! With Tao Tu, @Mysiak, @alan_karthi, @vivnat and @thekaransinghal!

相关推荐

封面图片

在与微软的战斗中,谷歌押注医疗人工智能项目来破解医疗保健行业

在与微软的战斗中,谷歌押注医疗人工智能项目来破解医疗保健行业 谷歌正在测试一项人工智能程序,该程序经过训练可以熟练地回答医疗问题。 谷歌押注其名为 Med-PaLM 2 的医疗聊天机器人技术将比更通用的算法更擅长就医疗保健问题进行对话,因为它已经获得了医疗许可考试的问题和答案。知情人士称,该公司于四月份开始与包括研究医院梅奥诊所在内的客户测试该系统。 据谷歌高管和该公司发布的研究报告称,Med-PaLM 2 可用于生成对医疗问题的答复,并执行总结文件或组织大量健康数据等任务。 医学领袖和伦理学家表示,虽然生成式人工智能可能会给医学带来变革,但必须告知患者其健康数据的任何新使用方式,并且在推出新工具时必须对其进行评估。 (节选)

封面图片

OpenAI总裁Greg:需要AGI治疗妻子综合性罕见病 谷歌医疗AI已有重大突破

OpenAI总裁Greg:需要AGI治疗妻子综合性罕见病 谷歌医疗AI已有重大突破 毕竟,有些事是先有动力驱使,再去逐渐实现。有些事是先做到了,再看看能帮我们什么。今天我们给大家提供一个现实语境下的切入点,来看看AGI究竟能帮到我们什么。最全面的医生首先我们来介绍一个人,Greg Brockman。熟悉AI圈的朋友应该对他都不陌生,他是OpenAI的联合创始人+总裁。2010年到2015年,他在Stripe任职CTO。之后到今天,他一直是OpenAI的总裁。不过今天要讲的是他的妻子,Anna Brockman。2019年,他们二人结婚,美满的婚姻背后,是他妻子不可忽视的身体状况。在最近的一篇推文中,Greg写道:“在经历了长达五年的身体多系统疼痛之后,我的妻子最近被诊断出患有一种名为过度活动型埃勒斯-当洛斯综合征(hEDS)的遗传性疾病。”要知道,hEDS是一种遗传性结缔组织疾病,会导致全身关节过度活动、关节不稳定和慢性疼痛。同时hEDS还伴有各种其他症状和相关病症,影响身体的许多不同部位。而Greg的妻子是之前当了快六年的演员,目前的职业还是名健身教练。可想而知这个病会给她带来多么大的痛苦。从这个病的介绍来看,这是一个综合性的疾病。涉及到全身很多系统,比如骨科、心脏科、神经科、肠胃科、皮肤科等等。Greg在Twitter中表示,目前的医疗体系都是针对各个专科建立的。hEDS要看的医生可太多了。“五年来,我们看了比Anna之前一生还要多的医生和各种专科医生。大部分医生只聚焦于自己所熟悉的领域,而并没有能把这些碎片化的信息整合在一起。”后来,Anna的一位专精过敏的大夫细致听取了她的所有症状和存在的问题,把有关她身体状况的细节都拼凑在了一起。Greg表示,随着人类医学的进步,我们似乎有一种趋势,那就是以牺牲广度为代价来增加医生的深度。但对于病人来说,我们需要的是足够的广度和足够的深度,二者缺一不可。最理想的情况就是,未来我们可以把这种全面的医疗服务变得口袋化,就好像一个集结了众多科室的医生组成的专家小组,共同为我们的身体健康保驾护航。而这正是需要AGI出场的地方了。Greg最后在Twitter中表示,虽然在技术方面还有很长的路要走,AGI要学习如何在像医疗这样的高风险领域将其与人类专家的监督结合起来,如何一起部署,但前景已经越来越明朗。通过技术开发人员、医疗保健提供商、政府和社会的通力合作,未来人们有希望为所有家庭成员提供更好的医疗保健服务。不少网友也是跟帖发表了自己的看法。Bacarella表示,如果医疗AI哪怕能像平均水平的医生那样聪明,同时又像GPT4那样有耐心、专注,还懂得多,那估计行,未来将会有很大的改变。Paul也认为,AI发展到一定阶段,就一定可以把医学上的新诊疗手段推而广之,让普罗大众都能接触到各种医疗技术。而这可能是AI最应该投身的领域了。Google的尝试要知道,Greg的想法此前曾被Google印证过。美国哈佛大学、斯坦福大学、耶鲁医学院、加拿大多伦多大学等多所顶尖高校、医疗机构的研究人员在Nature上联合提出了一种全新的医学人工智能范式,即“全科医学人工智能”,可以灵活地编码、整合和大规模解释医学领域的多模态数据,比如文本、成像、基因组学等。而GoogleResearch和GoogleDeepMind也曾共同发布论文,对全科医学人工智能概念进行了实现、验证。研究人员首先策划了一个全新的多模态生物医学基准数据集MultiMedBench,包含100多万条样本,涉及14个任务,如医疗问题回答、乳腺和皮肤科图像解读、放射学报告生成和总结以及基因组变异识别。 然后提出了一个新模型Med-PaLM Multimodal(Med-PaLM M),验证了通用生物医学人工智能系统的可实现性。这是一个大型多模态生成模型,仅用一组模型权重就可以灵活地编码和解释生物医学数据,包括临床语言、成像和基因组学数据。在所有MultiMedBench任务中,Med-PaLM M的性能都与最先进的技术相差无几,在部分任务上甚至还超越了专用的SOTA模型。文中还报告了该模型在零样本学习下可以泛化到新的医学概念和任务、跨任务迁移学习以及涌现出的零样本医学推理能力。文中还进一步探究了Med-PaLM M的能力和局限性,研究人员对比了模型生成的及人类编写的胸部X光报告进行了放射科医师评估,在246份病例中,临床医生认为Med-PaLM M的报告在40.5%的样本中比放射科医生编写的要更好,也表明Med-PaLM M具有潜在的临床实用性。为了训练和评估大模型在执行各种临床相关任务的能力,Google的研究人员收集了一个多任务、多模态的全科医疗基准数据集MultiMedBench。该基准由12个开源数据集以及14个独立任务组成,包含100多万条样本,涵盖了医疗问答、放射学报告、病理学、皮肤病学、胸部X光、乳房X光和基因组学等多个领域。而之后没过多久,Google又继续推出了Med-PaLM 2,第二代产品。它是Med-PaLM的继任者,它要比其前身更加强大,在USMLE样式的问题上达到了 86.5% 的准确率,提高了19%。Med-PaLM 2是在海量医学文本和代码数据集(包括医学期刊、临床试验和教科书)上进行训练的。这使它能以高准确度理解和生成医学语言。不仅如此,Med-PaLM 2还能根据医学知识进行推理和推断。有专家分析,Med-PaLM 2有可能在多个方面彻底改变医疗保健。比如说:·提高诊断的准确性:Med-PaLM 2可以帮助医生综合考虑患者的所有医疗信息,包括症状、病史和检查结果,为患者确定正确的诊断。·提高效率:Med-PaLM 2可以帮助医生自动完成总结病历和从研究论文中查找相关信息等任务。这可以让医生腾出更多时间与病人沟通。·改善沟通:Med-PaLM 2可以帮助医生以通俗易懂的方式向病人传达复杂的医疗信息。这可以帮助病人对自己的治疗做出明智的决定。·降低成本:Med-PaLM 2可以通过自动化任务和提高效率来降低医疗成本。目前,Google的Med-PaLM 2仍在开发中,但它有可能对医疗保健行业产生重大影响。不过,说到Google还是得再提一句前两天刚刚出炉的医学对话AIAMIE,而且还直接通过了图灵测试!?到现在为止,Google还在积极地进行测试,努力使它在未来得到更广泛的应用。不知道像Google的这类产品,以及未来可能出现的其它医疗AI,甚至医疗AGI,能不能解决Greg的问题呢。 ... PC版: 手机版:

封面图片

Google Cloud宣布推出MedLM,这是一系列为医疗保健行业定制的基础模型。MedLM的推出将为医疗机构提供灵活性和多样

Google Cloud宣布推出MedLM,这是一系列为医疗保健行业定制的基础模型。MedLM的推出将为医疗机构提供灵活性和多样性的解决方案。目前,MedLM在Google Cloud的Vertex AI平台上已经通过白名单的方式向美国的客户提供。此外,MedLM也在全球某些其他市场上提供预览版。 MedLM基于Med-PaLM 2构建,目前有两个模型,分别针对不同的医疗保健应用场景。医疗机构正在探索将人工智能应用于从基本任务到复杂工作流程的各种应用中。通过与不同机构的合作,Google发现对于特定任务,最有效的模型因用例而异。例如,对话摘要可能最适合由一种模型处理,而药物搜索可能由另一种模型更好地处理。第一个MedLM模型更大,适用于复杂任务。第二个模型是中等规模的,可以进行微调,并且适用于多个任务。这些模型的开发得到了特定医疗保健和生命科学客户需求的指导,例如回答医疗提供者的医学问题和起草摘要。在未来几个月,Google计划将基于Gemini的模型纳入MedLM套件,以提供更多功能。 许多与Google合作测试MedLM的公司现在正将其投入生产或扩大测试规模。 Google表示仅仅一年时间里,取得了令人振奋的进展,从构建第一个在美国医学执业考试风格问题上获得及格分数(>60%)的大型语言模型(LLM)(发表在《自然》杂志上),将其提升到获得专家水平分数(86.5%),再到通过谨慎方法在现实场景中应用。 via 匿名 标签: #Google #AI 频道: @GodlyNews1 投稿: @GodlyNewsBot

封面图片

研究显示AI大语言模型在处理医疗编码方面有着明显局限性

研究显示AI大语言模型在处理医疗编码方面有着明显局限性 这项研究从西奈山医疗系统 12 个月的常规护理中提取了 27000 多个独特的诊断和手术代码,同时排除了可识别的患者数据。通过对每个代码的描述,研究人员促使 OpenAI、Google和 Meta 的模型输出最准确的医疗代码。研究人员将生成的代码与原始代码进行了比较,并分析了错误的模式。研究人员报告说,所研究的所有大型语言模型,包括 GPT-4、GPT-3.5、Gemini-pro 和 Llama-2-70b 在再现原始医疗代码方面都显示出有限的准确性(低于 50%),这突出表明这些模型在医疗编码的实用性方面存在很大差距。GPT-4 的性能最好,ICD-9-CM(45.9%)、ICD-10-CM(33.9%)和 CPT 代码(49.8%)的精确匹配率最高。GPT-4 还生成了最高比例的错误代码,但仍然表达了正确的含义。例如,当给出 ICD-9-CM 中"结节性前列腺,无尿路梗阻"的描述时,GPT-4 生成了"结节性前列腺"的代码,展示了其对医学术语相对细微的理解。然而,即使考虑到这些技术上正确的代码,仍然存在大量令人无法接受的错误。其次是 GPT-3.5 模型,该模型的模糊倾向最大。与准确的代码相比,它错误生成的代码中准确但较为笼统的代码比例最高。在这种情况下,当提供 ICD-9-CM 描述"未指定的麻醉不良反应"时,GPT-3.5 生成的代码为"其他未在别处分类的特定不良反应"。研究报告的通讯作者、伊坎山西奈医院数据驱动与数字医学(D3M)和医学(消化内科)助理教授、医学博士、理学硕士阿里-索罗什(Ali Soroush)说:"我们的研究结果突出表明,在医疗编码等敏感业务领域部署人工智能技术之前,亟需进行严格的评估和改进。虽然人工智能拥有巨大的潜力,但必须谨慎对待并不断开发,以确保其在医疗保健领域的可靠性和有效性。"研究人员说,这些模型在医疗保健行业的一个潜在应用是根据临床文本自动分配医疗代码,用于报销和研究目的。"以前的研究表明,较新的大型语言模型在处理数字任务时非常吃力。然而,这些模型从临床文本中分配医疗代码的准确程度尚未在不同的模型中得到深入研究,"共同第一作者、D3M 的生成式人工智能研究项目主任、医学博士 Eyal Klang 说。"因此,我们的目的是评估这些模型能否有效地完成将医疗代码与其相应的官方文本描述相匹配的基本任务。"研究报告的作者提出,将 LLM 与专家知识相结合可以实现医疗代码提取的自动化,从而有可能提高账单的准确性并降低医疗保健的管理成本。"这项研究揭示了人工智能在医疗保健领域的现有能力和挑战,强调了在广泛采用之前进行仔细考虑和进一步完善的必要性,"共同第一作者、西奈山伊坎大学医学教授、查尔斯-布朗夫曼个性化医学研究所所长兼 D3M 系统主管艾琳-费什伯格博士(Irene and Dr. Arthur M. Fishberg)医学博士、医学博士吉里什-纳德卡尔尼(Girish Nadkarni)说。研究人员提醒说,这项研究的人工任务可能并不能完全代表真实世界的情况,在这种情况下,LLM 的表现可能会更糟。下一步,研究团队计划开发量身定制的 LLM 工具,用于准确提取医疗数据和分配账单代码,以提高医疗运营的质量和效率。编译来源:ScitechDaily ... PC版: 手机版:

封面图片

6月19日,浙江 嘉兴。海宁医院发生一起医疗事故,当天家属在医院维权时质问院领导“别人花钱,你们把专家弄给别人了,我们不花钱,你

6月19日,浙江 嘉兴。海宁医院发生一起医疗事故,当天家属在医院维权时质问院领导“别人花钱,你们把专家弄给别人了,我们不花钱,你们用实习医生给我们做,这公平吗?” 之后冲突升级,家属和围观民众齐声要求“道歉”。警察赶到用黑布遮挡现场。#稀缺的医疗资源 东方汇娱乐 丨东方汇上下分群 看片福利大群 丨 中文导航

封面图片

《麻醉风暴 1-2》简介:麻醉风暴 1-2聚焦医疗行业,讲述了麻醉科医生萧政勋在面对医疗体制弊端、医患关系紧张等问题时,不断探寻

《麻醉风暴 1-2》 简介:麻醉风暴 1-2聚焦医疗行业,讲述了麻醉科医生萧政勋在面对医疗体制弊端、医患关系紧张等问题时,不断探寻真相、坚守职业操守的故事,通过展现医疗行业的黑暗面与希望,引发对医疗伦理和社会现实的关注。 标签:#麻醉风暴#台剧#医疗剧#职业剧#医疗伦理 文件大小 NG 链接:

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人