易用性有时候是值得损失部分准确性的

易用性有时候是值得损失部分准确性的阅读BenThompson的文章https://stratechery.com/2023/the-openai-keynote/，分析非常有意思，其中有一章节，论述为什么OpenAIDevDay之后ChatGPT似乎淡化了Plugin的概念，而推出了新的产品交互形态，对比下前后两者的差别：之前：用户如果需要使用某一插件（如PDF总结），必须搜索安装插件，并在对话前切换打开插件，然后对话；之后：用户不再需要特意安装插件，直接点到侧边栏的GPTs（为某一场景专门定制的GPT），对话即可；这其中，虽然用户还是做了一次选择，但一开始插件就已经被集成到了GPTs中，这个整体操作和交互体验改变很大，它降低了用户的思考成本，只需要在合适的时候做一个简单的点击即可。作者由此引出自己的观点：1.消费者关心事物的方式和你赋予他们的期望可能不同，他们优先考虑易用性，对于模块化解决方案的“接缝感”会表现出明显的不满（比如ChatGPT之前的Plugin使用方式就是一种模块化方案）。2.综合的解决方案最终能够获胜，因为没有什么是“足够好的”，综合的解决方案也许会有缺陷（比如ChatGPT有时欠缺准确性），但是，这种缺陷是可以接受的，易用性是值得损失部分准确性的。3.客户会说自己需要准确性和第三方工具，但是他们的行动会证明，方便和易用才是最重要的。以上的观点启发很大，可见OpenAI正在从一家主要关注技术能力的公司，转变为同时关注产品能力和用户体验的公司。

在Telegram中查看

相关推荐

银河证券：OpenAI 发布 GPT-4o 模型，易用性大幅提升

银河证券：OpenAI发布GPT-4o模型，易用性大幅提升银河证券研报表示，北京时间2024年5月14日凌晨，OpenAI发布GPT-4的升级更新版本GPT-4o。随着2023年以来各种人工智能大模型的不断迭代更新，目前主流人工智能大模型的智能水平已经达到了相当的水平。GPT-4o的发布，标志着人工智能大模型在便利性和易用性上实现了突破，考虑到后续随着GPT-4o免费对用户开放，用户数量的快速增长确定性较高，银河证券认为，人工智能的对C端的影响力有望增强，看好相关垂类应用的发展前景。建议关注与C端用户体验密切相关的行业：1）AI+游戏：游戏内NPC互动、互动影游；2）AI+教育：智教系统、虚拟实验室；3）AI+办公：内容生成、非结构化数据处理；4）AI+出版：校对修改、智慧发行；5）AI+专业咨询：情感陪护，应用场景专业解答等。

欧盟数据保护委员会称 ChatGPT 的数据准确性仍未达标

欧盟数据保护委员会称ChatGPT的数据准确性仍未达标欧盟隐私监管机构的一个工作组称，OpenAI致力于减少其ChatGPT聊天机器人输出中的事实错误，但这不足以确保完全符合欧盟的数据规则。当地时间24日，该工作组在于其网站发布的一份报告中表示：“尽管为了遵守透明原则而采取的措施有利于避免对ChatGPT输出错误信息，但这些措施仍然不足以遵守数据准确性的原则。”在以意大利当局为首的国家监管机构对这项广泛使用的人工智能服务表示担忧后，欧盟数据保护委员会(EDPB)随后成立了“ChatGPT特别工作组”。——

ChatGPT在临床决策中显示出"令人印象深刻"的准确性

ChatGPT在临床决策中显示出"令人印象深刻"的准确性这款基于扩展语言模型的人工智能聊天机器人在不同医疗领域的初级保健和急诊环境中都表现出了一致的性能。研究结果最近发表在《医疗互联网研究杂志》上。"我们的论文全面评估了通过ChatGPT提供的决策支持，从一开始与病人打交道到整个护理场景，从鉴别诊断一直到检测、诊断和管理，"论文通讯作者、麻省总医院创新和商业化副主席兼战略创新领导者、MESH孵化器执行主任MarcSucci博士说。"目前还没有真正的基准，但我们估计这种表现相当于医学院刚毕业的实习生或住院医师的水平。这告诉我们，一般来说，LLM有潜力成为医学实践的辅助工具，并以令人印象深刻的准确性支持临床决策。"人工智能技术的变化日新月异，正在改变包括医疗保健在内的许多行业。然而，人们还没有研究过LLM在临床护理中的全面辅助能力。在这项关于如何将LLMs用于临床建议和决策的跨专业综合研究中，Succi和他的团队测试了一个假设，即ChatGPT能够在与患者的整个临床接触过程中提出诊断建议，决定临床管理方案，并最终做出诊断。这项研究是通过将36个已发表的标准化临床案例的连续部分粘贴到ChatGPT中完成的。首先，要求该工具根据患者的初始信息（包括年龄、性别、症状以及是否急诊）提出一系列可能的诊断或鉴别诊断。然后，ChatGPT获得更多信息，并被要求做出处理决定和给出最终诊断--模拟真实病人就诊的整个过程。研究小组在结构化盲法过程中比较了ChatGPT在鉴别诊断、诊断检测、最终诊断和处理方面的准确性，对正确答案给予评分，并使用线性回归评估ChatGPT的表现与小插图人口统计信息之间的关系。研究人员发现，总体而言，ChatGPT的准确率约为72%，在最终诊断方面表现最佳，准确率为77%。在进行鉴别诊断时，它的准确率最低，只有60%。而在临床管理决策方面，如在得出正确诊断后决定用什么药物治疗病人，其准确率仅为68%。研究中其他值得注意的发现包括，ChatGPT的答案没有显示出性别偏见，其在初级和急诊护理中的整体表现稳定。"ChatGPT在鉴别诊断方面表现不佳，而鉴别诊断是医生必须弄清楚该怎么做的医学难题，"Succi说。"这一点很重要，因为它告诉我们医生在哪些方面才是真正的专家，并能带来最大的价值--在病人护理的早期阶段，几乎没有什么现成的信息，这时需要一份可能的诊断清单。"作者指出，在考虑将ChatGPT等工具整合到临床护理中之前，需要更多的基准研究和监管指导。下一步，Succi的团队将研究人工智能工具能否改善医院资源有限地区的病人护理和治疗效果。人工智能工具在医疗领域的出现具有开创性意义，有可能积极重塑医疗服务的连续性。麻省总医院布里格姆分院作为全美顶尖的综合学术医疗系统和最大的创新企业之一，在对新兴技术进行严格研究方面处于领先地位，为将人工智能负责任地融入医疗服务、劳动力支持和管理流程提供依据。MassGeneralBrigham首席信息官兼数字高级副总裁AdamLandman（医学博士、理学硕士、医学信息管理硕士、MHS）表示："MassGeneralBrigham认为LLM在帮助改善医疗服务和临床医生体验方面大有可为。我们目前正在评估LLM解决方案，以协助临床工作。"...PC版：https://www.cnbeta.com.tw/articles/soft/1379469.htm手机版：https://m.cnbeta.com.tw/view/1379469.htm

【Manta Network核心贡献者Shumo：易用性是隐私产品普及的主要现实障碍】

【MantaNetwork核心贡献者Shumo：易用性是隐私产品普及的主要现实障碍】2月18日消息，MantaNetwork核心贡献者Shumo在ETHDenver线下活动上谈及为何隐私尚未得到重视时表示，人们对于区块链隐私性的看法和实际情况相差很大。很多时候人们以为加密货币一定是隐私的，但事实正好相反：用户所有重要的资产信息在链上都是公开的，一旦你和你的地址泄露，造成的影响将是永久的。从实际角度来讲，人们需要在隐私和便捷性之间做出一定的妥协。而Manta要做的事是将隐私产品打造地更加便捷易用。当前，隐私交易速度普遍较慢、gas费过高，这都是普及隐私所需要克服的障碍，也是MantaNetwork想要解决的问题。北京时间2月18日，MantaNetwork在ETHDenver期间举办线下meetup，分享最新的项目进展，同时与来自BinanceLabs、Parity、Polychain和Moonbeam的嘉宾共话Web3隐私。在此之前，Manta刚刚宣布获得BinanceLabs战略投资。

研究发现iOS系统比Android难上手易用性相差58%

研究发现iOS系统比Android难上手易用性相差58%结果发现，Android的易用性比iOS高出58%。据悉，在所有纳入考察的12项常见任务中，Android有10项都比iOS做得直观易用，后者仅在扫码和截屏的搜索量上胜过Android。最终，常见任务在iOS的月搜索量达到35.8万次，Android上是22.6万次，差距58.41%。当然，这种统计肯定有欠周全的方面，但在一定程度上还是有可参考性。...PC版：https://www.cnbeta.com.tw/articles/soft/1366905.htm手机版：https://m.cnbeta.com.tw/view/1366905.htm

Palm2 的准确性这么低。。能用吗。。

Palm2的准确性这么低。。能用吗。。Vlad: MotherofallLLMbenchmarks!-UseGPT-4ifyouneedbestquality-Useclaude-instant-v1foreverythingelse-GooglePaLM2isnowherenearOpenAI/Anthropic-OpenAImodelsarepainfullyslowcomparedtocompetition-Open-sourcemodelsnextsource:

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人