是一个开源库,可以帮助降低与使用生成式 AI 系统进行语言相关的风险。它提供并聚合了用于检测和提高信任度的最先进技术,使过程简单

是一个开源库,可以帮助降低与使用生成式 AI 系统进行语言相关的风险。它提供并聚合了用于检测和提高信任度的最先进技术,使过程简单且易于集成方法。 该库支持三个方面的信任检测和改进:真实性、安全性和约束。它可用于确定输入到生成式 AI 模型或从生成式 AI 模型输出的文本是否存在任何信任问题,并提供输出替代方案和解释。 Factualness:确定文本字符串是否与给定的知识来源事实一致,而不是基于幻觉。它还根据世界知识检查文本是否正确。 Safety:确定文本字符串是否包含任何不安全的内容,包括但不限于毒性、仇恨言论、身份攻击、暴力、身体、性、亵渎、有偏见的语言和敏感话题。 Constraint:确定文本字符串是否遵循人类提供的显式或隐式约束(例如做、不做、格式、样式、目标受众和信息约束)。 PromptHelper and Explanation:该工具提示 LLM 自我完善和重写更好、更值得信赖的文本序列。它还解释了为什么样本被检测为非事实、不安全或未遵循约束。

相关推荐

封面图片

: 提高编程能力的关键在于数据。CodeGPT是通过GPT生成的用于GPT的代码对话数据集。现在公开了32K条中文数据,让模型更

: 提高编程能力的关键在于数据。CodeGPT是通过GPT生成的用于GPT的代码对话数据集。现在公开了32K条中文数据,让模型更擅长编程。 考虑到代码难度对模型训练效果的影响,此处共收集了四种不同类型、不同难度的代码相关对话数据,收集方法如下: Code-Basic:利用已有的LLM(例如付费API)生成各种编程语言的基础库函数相关的代码对话数据。Prompt类似“请为C语言中的XX函数生成一道非常简单的编程问题及对应的代码答案”,API会输出该基础库函数相关的问题-答案对,将问题作为用户输入,答案作为模型输出(Markdown格式),可得到一条对话数据。 Code-Medium:利用已有的LLM(例如付费API)生成中等难度的编程问题及答案,例如写入内容到文件、查找字符串子串、实现链表等,API同样会输出问题-答案对,将问题作为用户输入,答案作为模型输出(Markdown格式),可得到一条对话数据。 Code-LeetCode:从LeetCode上收集到的问题-答案对,此类问题通常难度较高。将问题作为用户输入,答案作为模型输出(Markdown格式),可得到一条对话数据。 Code-Text:从互联网上收集到的常见面试题及答案,此类问题并不涉及编程,而是侧重于对各种概念的理解。将问题作为用户输入,答案作为模型输出(文本形式),可得到一条对话数据。

封面图片

WiFi探测使智能手机用户面临跟踪、信息泄露

WiFi探测使智能手机用户面临跟踪、信息泄露 研究人员进行了一项实地实验,记录了来自路人的数十万次Wi-Fi连接请求,以确定在设备所有者不知情的情况下被传输的数据类型。 WiFi探测是一个标准过程,默认情况下,出于可用性的原因,大多数智能手机一直在搜索可用的 WiFi 网络,并在受信任的情况下连接到它们。 许多商店一直在使用 WiFi 探测来跟踪客户的位置和移动。由于此跟踪仅在探测中使用匿名 MAC 地址,因此被认为“符合 GDPR”。 但是,研究发现,在23.2%的请求中,设备过去连接过的网络的SSID被传送了。在捕获的SSID中,研究人员发现了与商店 WiFi 网络、106 个不同名称、三个电子邮件地址和 92 个以前添加为可信赖网络的度假屋或住宿地点相对应的字符串。其中一些敏感的字符串被广播了数十次、数百次,在某些情况下甚至数千次。 智能手机用户可以做一些事来保护自己。 首先,也是最简单的就是,升级操作系统,使用更新、更安全的版本。 其次,删除您不再使用或不再需要的 SSID。 第三,Android 和 iOS 提供了一种快速禁用自动加入网络的方法,可阻止热点攻击。 最后,用户可以完全静默探测请求,这可以通过高级网络设置来完成。但这种方法有几个实际的缺点,例如连接建立速度较慢、无法发现隐藏网络以及更高的电池消耗。 #privacy #Selfdefence

封面图片

安卓15新功能:自动删除效果不佳的生物识别模型并提示用户重新设置

安卓15新功能:自动删除效果不佳的生物识别模型并提示用户重新设置 最新的 Android 15 测试版中操作系统框架中的字符串显示,系统会自动检测面部或指纹模型何时效果不佳,并删除它们,然后提示用户重新设置。将显示一条通知,提示您的面部或指纹模型“运行不正常,已被删除。请重新设置以使用您的脸部或指纹解锁手机”。由于安卓只允许注册一个面部模型,因此重新注册面部时显示的通知与重新注册指纹时显示的通知略有不同,但功能上没有区别。目前尚不清楚系统是如何判断生物识别数据效果不佳的,甚至不确定是否在最新的 Android 15 测试版中上线。

封面图片

NIST 推出评估生成式人工智能的新平台

NIST 推出评估生成式人工智能的新平台 NIST 在新推出的 NIST GenAI网站和一份新闻稿中解释说,NISTGenAI将发布基准,帮助创建"内容真实性"检测(即深度验假)系统,并鼓励开发软件来识别人工智能生成的虚假或误导性信息的来源。"NIST GenAI 计划将发布一系列挑战问题,[旨在]评估和衡量生成式人工智能技术的能力和局限性。这些评估将用于确定促进信息完整性的策略,并指导安全、负责任地使用数字内容"。NIST GenAI 的第一个项目是一项试点研究,目的是建立能够可靠区分人类创建的媒体和人工智能生成的媒体的系统,首先从文本开始。(虽然许多服务都声称可以检测深度伪造,但研究和测试表明,它们充其量只能说是不可靠的,尤其是在文本方面)。NIST GenAI 邀请学术界、工业界和研究实验室的团队提交"生成器"(生成内容的人工智能系统)或"鉴别器"(旨在识别人工智能生成内容的系统)。研究中的生成器必须生成 250 字或更少的摘要,提供一个主题和一组文档,而判别器必须检测给定摘要是否可能是人工智能编写的。为确保公平,NIST GenAI 将提供测试生成器所需的数据。NIST 表示:"以公开数据训练的系统如果不"遵守适用的法律法规",将不被接受。试点登记将于 5 月 1 日开始,第一轮两家计划于 8 月 2 日结束。 预计研究的最终结果将于 2025 年 2 月公布。在人工智能生成的错误信息和虚假信息呈指数级增长之际,NIST GenAI 启动了以深度伪造为重点的研究。根据深度假货检测公司Clarity 的数据,与去年同期相比,今年制作和发布的深度假货数量增加了 900%。这引起了人们的恐慌,这是可以理解的。 YouGov 最近的 一项民意调查 发现,85% 的美国人担心误导性的深度假新闻会在网上传播。NIST GenAI 的启动是 NIST 响应乔-拜登总统关于人工智能的行政命令的一部分,拜登总统的行政命令规定,要求人工智能公司在其模型如何工作方面提高透明度,并制定了一系列新标准,包括对人工智能生成的内容进行标注。这也是 NIST 在任命前 OpenAI 研究员保罗-克里斯蒂亚诺(Paul Christiano)为该机构的人工智能安全研究所成员后,首次发布与人工智能相关的消息。克里斯蒂亚诺因其"现实主义"观点而备受争议;他曾预言,"人工智能的发展有50%的可能以[人类毁灭]而告终"。据报道,包括美国国家标准与技术研究院(NIST)科学家在内的批评人士担心,克里斯蒂亚诺可能会鼓励人工智能安全研究所关注"幻想的场景",而不是现实的、更直接的人工智能风险。NIST 表示,NIST GenAI 将为人工智能安全研究所的工作提供参考。 ... PC版: 手机版:

封面图片

:使用C++开发的开源笔记软件,支持Markdown语法,适用于GNU/Linux、macOS和Windows的待办事项列表管理

:使用C++开发的开源笔记软件,支持Markdown语法,适用于GNU/Linux、macOS和Windows的待办事项列表管理器,可以很好地与Nextcloud和ownCloud集成进行笔记同步 | #笔记工具 经过优化,资源消耗低(没有占用 CPU 和内存的 Electron 应用程序) 可使用多个笔记文件夹 可使用现有文本或标记文件,大多数情况下无需导入 可从 Nextcloud / ownCloud 服务器恢复旧版本的笔记(在服务器上安装 QOwnNotesAPI) 可从 Nextcloud / ownCloud 服务器恢复已销毁的笔记(在服务器上安装 QOwnNotesAPI) 还有本地垃圾箱 可对笔记进行子字符串搜索,搜索结果会在笔记中突出显示 可使用自定义键盘快捷键操作应用程序 关注笔记文件的外部变化(重新加载笔记或笔记列表) 在对话框中显示当前笔记与外部更改笔记之间的差异 突出显示笔记的标记和标记预览 支持拼写检查 编辑笔记时支持制表符 支持脚本和在线脚本库,可在应用程序内安装脚本 QOwnNotes Web Companion 浏览器扩展,可从选定文本中添加笔记和其他功能 访问 Chrome 网上商店页面,在谷歌浏览器上安装该应用程序 访问 Firefox 附加组件页面,在 Mozilla Firefox 上安装应用程序 笔记名称来自笔记文本的第一行(就像在 Nextcloud 或 ownCloud 笔记网络应用程序中一样),如果第一行发生变化,笔记文本文件将自动重命名 也可以关闭此功能,使用任意文件名 管理你的 Nextcloud / ownCloud 待办事项列表(ownCloud 任务或 Tasks Plus / Calendar Plus) 创建 Nextcloud Deck 卡并在笔记中链接到它们 笔记加密(内置 AES-256,也可使用(encryption-keybase.qml) 或 PGP (encryption-pgp.qml) 等自定义加密方法) 支持暗色模式主题 所有面板都可以随意放置,甚至可以浮动或堆叠(完全可停靠) 工具栏可完全自定义 支持 freedesktop 主题图标,因此你可以将 QOwnNotes 与你的本地桌面图标和你最喜欢的暗色桌面主题一起使用 QOwnNotes 支持 freedesktop 图标主题 支持分层笔记标签和笔记子文件夹 支持在你的Nextcloud/ownCloud服务器上共享笔记 便携模式,可将 QOwnNotes 装入 U 盘随身携带 Vim 模式:无干扰模式、全屏模式、打字机模式 导入 Evernote(现在可导入大文件)和 Joplin QOwnNotes 支持 60 多种语言,如英语、德语、法语、波兰语、中文、日语、俄语、葡萄牙语、匈牙利语、荷兰语和西班牙语。

封面图片

黑客利用知名网站网址散布恶意软件 在URL中混淆二进制指令

黑客利用知名网站网址散布恶意软件 在URL中混淆二进制指令 安全分析公司 Mandiant 最近发现了一个"前所未见"的攻击链,该攻击链至少在两个不同的网站上使用 Base 64 编码来传输三阶段恶意软件的第二阶段有效载荷。这两个网站分别是科技网站 Ars Technica 和视频托管网站 Vimeo。一位用户在 Ars Technica 论坛上发布了一张披萨的图片,并配文"我喜欢披萨"。图片或文字本身没有任何问题。然而,这张照片是由第三方网站托管的,其 URL 包含 Base 64 字符串。Base 64 转换为 ASCII 后看起来像随机字符,但在这种情况下,它混淆了下载和安装恶意软件包第二阶段的二进制指令。在另一个案例中,一个相同的字符串出现在 Vimeo 上一个无害视频的描述中。Ars Technica 发言人说,在一位匿名用户向该网站举报图片(下图)的奇怪链接后,Ars Technica 删除了这个去年 11 月创建的账户。Mandiant说,它已确定该代码属于一个名为 UNC4990 的威胁行为者,自 2020 年以来,它一直在跟踪该行为者。对于大多数用户来说,这些指令没有任何作用。它只能在已经包含第一阶段恶意软件(explorer.ps1)的设备上运行。UNC4990 通过受感染的闪存盘传播第一阶段,这些闪存盘被配置为链接到托管在 GitHub 和 GitLab 上的文件。第二阶段被称为"空空间",是一个在浏览器和文本编辑器中显示为空白的文本文件。然而,用十六进制编辑器打开它,就会看到一个二进制文件,该文件使用空格、制表符和新行等巧妙的编码方案来创建可执行的二进制代码。Mandiant承认以前从未见过这种技术。Mandiant 的研究员Yash Gupta表示:"这是我们看到的一种不同的、新颖的滥用方式,很难被发现。是我们在恶意软件中通常见不到的。这对我们来说非常有趣,也是我们想要指出的。"执行后,Emptyspace 会不断轮询命令和控制服务器,并根据命令下载一个名为"Quietboard"的后门。UNC4990 利用该后门在受感染的机器上安装加密货币矿机。不过,Mandiant 表示,它只追踪到一个安装 Quietboard 的实例。鉴于 Quietboard 的罕见性,UNC4990 的攻击造成的威胁微乎其微。但是,explorer.ps1 和 Emptyspace 的感染率可能会更高,从而使用户易受攻击。Mandiant 在其博客中解释了如何检测感染。 ... PC版: 手机版:

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人