DeepMind"钓鱼执法":让AI引诱AI说错话,发现数以万计危险言论 #抽屉IT

None

相关推荐

封面图片

欧几里得空间望远镜捕捉到数以万计的闪烁星系

欧几里得空间望远镜捕捉到数以万计的闪烁星系 为庆祝望远镜早些时候发布的观测结果并首次发表 ,欧洲空间局发布了这些令人叹为观止的星空景象 标签: #宇宙 #欧洲空间局 频道: @GodlyNews1 投稿: @GodlyNewsBot

封面图片

哈马斯:若以军袭击拉法市或将造成“数以万计”人员伤亡

哈马斯:若以军袭击拉法市或将造成“数以万计”人员伤亡 巴勒斯坦激进组织哈马斯星期六(2月10日)警告说,如果以色列军方向加沙南部拉法市发动攻击,可能会造成“数以万计”的人员伤亡。 法新社报道,以色列总理内坦亚胡星期五(9日)透露,他已命令军方制定一项双重计划,从拉法市撤离平民,并击败残余的哈马斯武装分子。 哈马斯星期六在一份声明中说,任何军事行动都将造成灾难性后果,“如果拉法……遭到入侵,可能会导致数万人殉难或受伤。”它还称,如果发生这种情况,将追究美国政府、国际社会和以色列的责任。 有目击者说,拉法市在星期六早些时候遭到新一轮袭击。 自以色列威胁对毗邻埃及边境的拉法市发动地面攻势以来,国际社会日益担忧在拉法市避难的巴勒斯坦人的安危。联合国称,加沙240万人口中,约有一半目前在拉法市避难,并面对缺乏食物、水和卫生设施的窘境。 联合国近东巴勒斯坦难民救济和工程处(UNRWA)负责人拉扎里尼星期五说,以色列在拉法发动大规模攻势“只会造成更多无尽的悲剧”。 2024年2月10日 7:25 PM

封面图片

Google DeepMind 推出评估AI模型危险性的新框架

Google DeepMind 推出评估AI模型危险性的新框架 访问:NordVPN 立减 75% + 外加 3 个月时长 另有NordPass密码管理器 根据一份与 Semafor 独家分享的声明,DeepMind 将与其他公司、学术界和立法者合作,共同完善该框架。该公司计划在2025年前开始实施其审计工具。如今,评估功能强大的前沿人工智能模型更像是一个临时过程,随着研究人员开发新技术而不断演变。"红队"会花费数周或数月的时间对其进行测试,尝试可能绕过保障措施的不同提示。然后,公司会采用各种技术,从强化学习到特殊提示,使模型符合要求。这种方法对现在的模型很有效,因为它们还不够强大,不足以构成太大的威胁,但研究人员认为,随着模型能力的增强,需要一个更强大的过程。批评者担心,当人们意识到这种技术已经走得太远时,为时已晚。DeepMind 发布的"前沿安全框架"希望解决这个问题。这是包括 Meta、OpenAI 和微软在内的主要科技公司为减轻人们对人工智能的担忧而宣布的几种方法之一。该公司表示:"尽管这些风险超出了现有模型的能力范围,但我们希望实施和改进该框架将有助于我们做好应对这些风险的准备。"DeepMind 开发人工智能模型"预警"系统已有一年多时间。它还发表了关于评估模型的新方法的论文,这些方法远远超出了目前大多数公司所使用的方法。前沿模型框架将这些进展纳入一套简洁的协议中,包括对模型的持续评估,以及研究人员在发现所谓"临界能力水平"时应采取的缓解方法。这可能是指模型能够通过操纵人类对其施加意志,在人工智能研究领域被称为"超常代理",也可能是指模型具有编写复杂恶意软件的能力。DeepMind 为四个领域设定了具体的关键能力级别:自主、生物安全、网络安全和机器学习研发。该公司表示:"在降低风险与促进获取和创新之间取得最佳平衡,对于负责任地发展人工智能至关重要。"DeepMind 将于下周在首尔举行的人工智能安全峰会上讨论该框架,届时其他行业领袖也将出席。令人鼓舞的是,DeepMind 的人工智能研究人员正在用更科学的方法确定人工智能模型内部发生了什么,尽管他们还有很长的路要走。研究人员在能力方面取得突破的同时,也在提高他们理解并最终控制这些软件的能力,这对人工智能安全也很有帮助。不过,今天发布的论文对如何进行这些评估的技术细节着墨不多。就目前而言,可以说我们还不知道目前的技术是否能让这个框架取得成功。这其中还有一个有趣的监管因素。由加州参议员斯科特-维纳(Scott Wiener)发起的一项新的人工智能综合法案将要求人工智能公司在训练模型之前对其危险性进行评估。这个框架是目前看到的第一个可能使遵守该法律成为可能的框架。但同样还不清楚技术上是否可行。还有一点:构建这些技术还有另一种用途:它可以帮助公司预测人工智能模型的能力在未来数月或数年内会发生怎样的变化。这些知识可以帮助产品团队更快地设计出新产品,从而为Google和其他有能力进行这些评估的公司带来优势。了解更多: ... PC版: 手机版:

封面图片

12月31日,美国科罗拉多州野火肆虐,数以万计的居民被迫离开家园。

12月31日,美国科罗拉多州野火肆虐,数以万计的居民被迫离开家园。 大火在30日上午于丹佛郊外爆发,造成约580座房屋,一家酒店和一个购物中心被毁,至少一名急救人员和其他6人受伤。博尔德县警长乔·佩勒表示,由于大火的强度,阵风高达每小时169公里,可能会有更多人受伤甚至死亡。一些副警长和消防员待在由于大火蔓延而不得不离开的区域。 临近的路易斯维尔和苏必利尔两城镇共有3.4万人居住,当地居民在大火前撤离。虽然居民在撤离时相当平静有序,但仍然拥堵了蜿蜒的街道。天空被大火引起的烟雾笼罩,能见度太低,巴士不得不靠在路边停车直至护送车辆抵达。 佩勒说,第一次大火发生在上午10时30分之前,并没有给建筑物造成任何损失。刚过11时,第二次大火迅速蔓延,覆盖了约6.5平方公里。当局表示,该地区的几起大火中,有一些是由倒下的电线引起的。 科罗拉多州弗兰特岭是该州多数人口居住的地方。当地经历了一个极其干燥且温暖的秋天,且到目前为止的大部分冬天也比较干燥。博尔德县90%的地区处于严重或极端干旱状态。 (美联社)

封面图片

做国内资金,买卖人口 畜牲不如,不发工资,拖欠我本人代理线数以万计 坑蒙拐骗

做国内资金,买卖人口 畜牲不如,不发工资,拖欠我本人代理线数以万计 坑蒙拐骗 在木牌都注意此狗,用各种高点位来忽悠,给你一次机会联系我发工资 再一次曝光你半张脸,你也是要面子的人,在不发工资 曝光你全部国内信息 ttttmm87 #柬埔寨 #木牌 #金沙赌场#包荣国

封面图片

Google DeepMind 发现让AI"深呼吸"后会使能力暴涨

Google DeepMind 发现让AI"深呼吸"后会使能力暴涨 Google DeepMind 的新研究发现,相比可以大幅提高语言模型能力的经典提示词"让我们一步一步思考",如果在前面加上"让我们先深呼吸一下",语言模型在 GSM8K 上的成绩会从71.8飙升到80.2。这对于一个没鼻没肺的机器人来说很奇怪,不过也开阔了人们使用提示词的思路。 "深呼吸"这个提示词是AI自己找到的,Google DeepMind 使用了一种叫 OPRO (Optimization by PROmpting) 的方法,AI会对AI的回答打分,递归调用优化问题描述,最终发现最优提示词。研究团队还发现,语言模型优化后的提示词明显优于人类设计,有时表现超50%。 网友开玩笑到「接下来他们将需要8小时的休息并在早上盯着阳光才能保持高效。」 还有网友嘲讽了语言模型的安全训练「抱歉,作为 OpenAI 创建的大型语言模型,我无法"深呼吸"。」

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人