#英国机构发布测试 #人工智能模型安全性的工具

英国机构发布测试人工智能模型安全性的工具

英国机构发布测试人工智能模型安全性的工具英国人工智能安全机构英国安全研究所发布了一套工具集，旨在通过让行业、研究机构和学术界更容易开发人工智能评估来“加强人工智能安全”。该工具集名为 Inspect，可在开源许可证 (特别是 MIT 许可证) 下使用，旨在评估人工智能模型的某些功能，包括模型的核心知识和推理能力，并根据结果生成分数。英国安全研究所声表示，Inspect 标志着“首次由国家支持的机构牵头的人工智能安全测试平台发布以供更广泛使用”。Inspect 由三个基本组件组成：数据集、求解器和评分器。数据集为评估测试提供样本。求解器负责执行测试。评分器评估求解器的工作，并将测试中的分数汇总为指标。Inspect 的内置组件可以通过用 Python 编写的第三方包进行增强。、、

英国安全研究所发布人工智能模型安全性测试工具

英国安全研究所发布人工智能模型安全性测试工具在周五宣布这一消息的新闻稿中，安全研究所声称，Inspect 标志着"由国家支持的机构主导的人工智能安全测试平台首次被广泛使用"。安全研究所主席伊恩-霍加斯（Ian Hogarth）在一份声明中说："人工智能安全测试方面的成功合作意味着要有一个共享的、可访问的评估方法，我们希望Inspect能够成为一个基石。我们希望看到全球人工智能社区利用Inspect不仅开展自己的模型安全性测试，而且帮助调整和构建开源平台，以便我们能够全面开展高质量的评估。"众所周知，人工智能基准很难制定其中最重要的原因是，当今最复杂的人工智能模型几乎都是黑盒，其基础设施、训练数据和其他关键细节都被创建这些模型的公司保密。那么，Inspect 如何应对这一挑战呢？主要是通过可扩展的新测试技术。Inspect 由三个基本部分组成：数据集、求解器和评分器。数据集为评估测试提供样本。求解器负责执行测试。评分器负责评估求解器的工作，并将测试得分汇总为指标。可以通过用 Python 编写的第三方软件包来增强 Inspect 的内置组件。Mozilla 研究员、著名人工智能伦理学家德博拉-拉吉（Deborah Raj）在 X 上发表了一篇文章，称 Inspect "证明了对人工智能问责开源工具的公共投资的力量"。人工智能初创公司Hugging Face的首席执行官克莱门特-德朗格（Clément Delangue）提出了将Inspect与Hugging Face的模型库整合在一起，或利用工具集的评估结果创建一个公共排行榜的想法。Inspect 发布之前，美国政府机构国家标准与技术研究院（NIST）启动了NIST GenAI，该计划旨在评估各种生成式人工智能技术，包括文本和图像生成人工智能。NIST GenAI 计划发布基准，帮助创建内容真实性检测系统，并鼓励开发能识别虚假或误导性人工智能生成信息的软件。今年 4 月，美国和英国宣布建立合作伙伴关系，共同开发先进的人工智能模型测试，这是继去年 11 月英国在布莱切利公园举行的人工智能安全峰会上宣布承诺之后的又一合作。作为合作的一部分，美国打算成立自己的人工智能安全研究所，广泛负责评估人工智能和生成式人工智能的风险。 ... PC版：手机版：

美国和英国将合作测试人工智能安全威胁模型

美国和英国将合作测试人工智能安全威胁模型两国人工智能安全研究所之间的协议立即生效。美国商务部长吉娜-雷蒙多（Gina Raimondo）表示，美国政府"致力于与其他国家发展类似的伙伴关系，在全球范围内促进人工智能安全"。雷蒙多在一份声明中说："这种合作关系将加速我们两家机构在各种风险方面的工作，无论是对我们的国家安全还是对我们更广泛的社会面。"通过该协议，两国承诺在技术研究、人员交流和信息共享方面开展合作。美国和英国的一个潜在合作伙伴是欧盟，欧盟通过了自己的人工智能系统使用全面法规。欧盟的人工智能法要求运行强大的人工智能模型的公司遵守安全标准。英国的人工智能安全研究所是在 11 月的全球人工智能峰会前夕成立的，包括美国副总统卡马拉-哈里斯在内的多位世界领导人在峰会上讨论了如何利用并在可能的情况下对该技术进行跨境监管。英国已经开始对一些模型进行安全测试，但目前还不清楚它是否能获得最近发布的版本。一些人工智能公司敦促英国人工智能安全研究所进一步明确时间表，以及在发现模型存在风险时的下一步措施。 ... PC版：手机版：

Anthropic 发布新的人工智能模型更新

Anthropic 发布新的人工智能模型更新人工智能公司 Anthropic 推出了其最新模型 Claude 3.5 Sonnet，据称该模型在各种任务中的表现可与 OpenAI 的 GPT-4.o 或谷歌的 Gemini 相媲美甚至更胜一筹。新模型已在网页和 iOS 上供 Claude 用户使用，并且也将向开发者提供。Claude 3.5 Sonnet 在编写和翻译代码、处理多步骤工作流程、解释图表和图形以及从图像转录文本方面将表现得更好。

阿联酋发布“猎鹰”人工智能模型挑战 Meta、OpenAI

阿联酋发布“猎鹰”人工智能模型挑战 Meta、OpenAI Falcon 是一个大型语言模型，类似于 OpenAI 的 GPT 和Google的双子座（Gemini）为聊天机器人、图像生成器和其他生成式人工智能工具提供动力的计算系统。Falcon 于 2023 年首次推出，它是开源的，这意味着它的代码可以广泛共享。据猎鹰背后的阿布扎比集团技术创新研究所（TII）称，猎鹰的新版本猎鹰2 11B比Meta Platforms公司最新推出的同类开源模型更强大，在某些指标上与双子座不相上下。先进技术研究委员会（TII 的出资政府实体）秘书长费萨尔-班奈（Faisal Al Bannai）在接受采访时说："我们能够实现比许多大公司更高的性能。而我们的计算能力和团队规模只是他们的一小部分。"阿拉伯联合酋长国正在自上而下齐心协力地推动人工智能的发展，将这项技术视为继石油之后的下一个经济支柱。这个海湾国家推出了一系列新业务和一个可能达到 1000 亿美元的人工智能投资工具。虽然阿联酋和沙特阿拉伯已经宣布了雄心勃勃的人工智能投资计划，但这两个海湾国家不得不引进大量的工程专业知识，并且刚刚开始将生成式人工智能工具应用到企业中。去年秋天，TII 称其第一版 Falcon 的下载量超过 1200 万次。Meta 公司表示，其最新的 Llama 模型获得了 1.7 亿次下载。去年 11 月，先进技术研究委员会（Advanced Technology Research Council）宣布成立 AI71 公司，这是一家致力于将 Falcon 商业化的新公司。Al Bannai 说，AI71 已经开始与阿联酋的合作伙伴一起在医院、律师事务所和呼叫中心试用这项技术，并计划很快扩展到国外。他拒绝透露政府为开发 Falcon 投入了多少资金，但他说，一个由大约 60 名研究人员组成的团队正在为 TII 开发几项人工智能服务。据 TII 称，新版 Falcon 支持五种欧洲语言和"视觉转语言功能"一种能让计算机将图像流畅地转换成文本的工具。据 Al Bannai 称，这种能力是阿布扎比为 Falcon 设计的某些商业应用的关键。他说："分析某人胸部的 X 光片、分析教育文件、分析建筑文件我们正试图将重点放在能够产生重大影响的非常明确的企业用例上。"这位官员说，今后，人工智能系统的开发将由一个新组织负责，名为猎鹰基金会（Falcon Foundation），以非营利性软件机构 Linux 基金会为蓝本。阿尔-班奈说，这将包括一个章程，以确保猎鹰"永远保持开源"。他说，该模型的另一个版本将在未来两个月内发布。本周一早些时候，阿布扎比人工智能公司G42（该公司的支持者之一是微软公司）为其阿拉伯语人工智能聊天机器人Jais发布了一款新应用。 ... PC版：手机版：

英国开始起草针对最强大模型的人工智能法规

英国开始起草针对最强大模型的人工智能法规知情人士透露，英国正开始起草人工智能管理法规，重点关注 OpenAI 的 ChatGPT 所依赖的最强大的语言模型。据匿名知情人士透露，科学、创新和技术部政策官员正处于制定立法的早期阶段，以限制新兴技术可能造成的危害。他们表示，目前还没有法案即将出台，政府可能会等到今年晚些时候或明年年初法国举办人工智能会议时，再就该主题展开磋商。另外，知情人士称，“科技部”和“文化、媒体和体育部”官员还提议修改英国版权法，允许公司和个人选择不允许语言模型抓取他们的内容，这是娱乐业特别关注的问题。知情人士表示，苏纳克办公室尚未决定是否就版权问题展开磋商，该问题与政府正在制定的更广泛的人工智能立法无关，而且创意产业和科技公司在这一问题上仍然存在分歧。

相关推荐