通过改进单元测试 生成式AI可以帮助大大减少软件的错误率

通过改进单元测试 生成式AI可以帮助大大减少软件的错误率 根据分析机构 IDC 的预测,到 2028 年,生成式人工智能(GenAI)将在很大程度上接管编码的这一环节,70% 的此类测试将由人工智能创建。一些程序员认为单元测试也有点令人困惑,因此让人工智能编写更好的测试应该能提高交付给最终用户的代码的整体质量。IDC 亚太区数字创新、xOps 和开发人员战略高级研究经理 Dhiraj Badgujar 在谈到亚洲采用 GenAI 创建测试时说:"生成式人工智能辅助软件开发(包括代码生成、用户界面、测试和其他用例)的亚太市场正在迅速增长。中国、印度和日本正在大力投资,以提高软件测试能力。IT 行业的稳健性和对质量保证的重视正在推动市场进步"。有了 GenAI 编写的更好、更全面的单元测试,开发人员就可以腾出时间,专注于为他们正在开发的软件创建新功能。如前所述,这些全面的单元测试还能捕捉到更多程序错误,从而减少软件错误。人工智能将使我们的软件变得更安全,这种想法其实非常有趣,因为 Rust 内建了内存安全功能,而且越来越受欢迎。利用低级编程语言创建的软件之所以存在大量漏洞,其中一个原因就是内存问题。如果有更多的软件使用 Rust 制作,并使用人工智能进行更好的单元测试,那么到本世纪末,我们就有可能看到非常可靠的软件问世。 ... PC版: 手机版:

相关推荐

封面图片

NIST 推出评估生成式人工智能的新平台

NIST 推出评估生成式人工智能的新平台 NIST 在新推出的 NIST GenAI网站和一份新闻稿中解释说,NISTGenAI将发布基准,帮助创建"内容真实性"检测(即深度验假)系统,并鼓励开发软件来识别人工智能生成的虚假或误导性信息的来源。"NIST GenAI 计划将发布一系列挑战问题,[旨在]评估和衡量生成式人工智能技术的能力和局限性。这些评估将用于确定促进信息完整性的策略,并指导安全、负责任地使用数字内容"。NIST GenAI 的第一个项目是一项试点研究,目的是建立能够可靠区分人类创建的媒体和人工智能生成的媒体的系统,首先从文本开始。(虽然许多服务都声称可以检测深度伪造,但研究和测试表明,它们充其量只能说是不可靠的,尤其是在文本方面)。NIST GenAI 邀请学术界、工业界和研究实验室的团队提交"生成器"(生成内容的人工智能系统)或"鉴别器"(旨在识别人工智能生成内容的系统)。研究中的生成器必须生成 250 字或更少的摘要,提供一个主题和一组文档,而判别器必须检测给定摘要是否可能是人工智能编写的。为确保公平,NIST GenAI 将提供测试生成器所需的数据。NIST 表示:"以公开数据训练的系统如果不"遵守适用的法律法规",将不被接受。试点登记将于 5 月 1 日开始,第一轮两家计划于 8 月 2 日结束。 预计研究的最终结果将于 2025 年 2 月公布。在人工智能生成的错误信息和虚假信息呈指数级增长之际,NIST GenAI 启动了以深度伪造为重点的研究。根据深度假货检测公司Clarity 的数据,与去年同期相比,今年制作和发布的深度假货数量增加了 900%。这引起了人们的恐慌,这是可以理解的。 YouGov 最近的 一项民意调查 发现,85% 的美国人担心误导性的深度假新闻会在网上传播。NIST GenAI 的启动是 NIST 响应乔-拜登总统关于人工智能的行政命令的一部分,拜登总统的行政命令规定,要求人工智能公司在其模型如何工作方面提高透明度,并制定了一系列新标准,包括对人工智能生成的内容进行标注。这也是 NIST 在任命前 OpenAI 研究员保罗-克里斯蒂亚诺(Paul Christiano)为该机构的人工智能安全研究所成员后,首次发布与人工智能相关的消息。克里斯蒂亚诺因其"现实主义"观点而备受争议;他曾预言,"人工智能的发展有50%的可能以[人类毁灭]而告终"。据报道,包括美国国家标准与技术研究院(NIST)科学家在内的批评人士担心,克里斯蒂亚诺可能会鼓励人工智能安全研究所关注"幻想的场景",而不是现实的、更直接的人工智能风险。NIST 表示,NIST GenAI 将为人工智能安全研究所的工作提供参考。 ... PC版: 手机版:

封面图片

:关于在软件测试中使用大型语言模型 (LLM) 的论文和资源的集合。

:关于在软件测试中使用大型语言模型 (LLM) 的论文和资源的集合。 LLM已成为自然语言处理和人工智能领域的突破性技术。这些模型能够执行各种与编码相关的任务,包括代码生成和代码推荐。因此,在软件测试中使用LLM预计会产生显着的改进。一方面,软件测试涉及诸如单元测试生成之类的任务,这些任务需要代码理解和生成。另一方面,LLM可以生成多样化的测试输入,以确保全面覆盖正在测试的软件。 此存储库对LLM在软件测试中的运用进行了全面回顾,收集了 102 篇相关论文,并从软件测试和法学硕士的角度进行了全面的分析。

封面图片

【Meta 正在创建专注于生成式 AI 的产品团队】

【Meta 正在创建专注于生成式 AI 的产品团队】 Meta首席执行官马克·扎克伯格(MarkZuckerberg)表示,「Meta正在创建一个专注于生成式人工智能(AI)的产品团队,短期计划是专注于构建富有创造性和表现力的工具,长期目标是开发可以在许多方面帮助人们的人工智能角色。Meta正在探索文本、图像、视频和多模式体验。」

封面图片

苹果开发AI工具帮助开发人员编写应用代码

苹果开发AI工具帮助开发人员编写应用代码 Xcode AI 工具将能够预测并完成代码块,让开发者能够简化应用创建流程。苹果公司目前正在内部测试这一功能,并计划"最早在今年"向第三方软件开发商发布。苹果公司还在测试人工智能生成的应用测试代码,并要求一些工程师在内部试用这些功能。添加到 Xcode 中的人工智能功能将与苹果计划添加到Siri和其他内置应用程序中的其他几项人工智能功能一起使用。一些新功能可能包括在Apple Music中生成播放列表和在 Keynote 中创建幻灯片,苹果还在努力改进 Spotlight 搜索功能。搜索功能可能包括应用程序中的特定功能,也可能为复杂的问题提供回复,该功能使用大型语言模型构建。据彭博社报道,苹果软件主管克雷格-费德里吉(Craig Federighi)已要求员工为iOS 18、iPadOS 18 和 macOS 15 创建尽可能多的新人工智能功能。苹果计划推出"大量新的人工智能功能",而 iOS 18 将被宣传为iPhone推出以来最大的更新之一。部分人工智能功能将出现在 macOS 上,但苹果计划"采取渐进的方式进行人工智能开发",有些功能"数年内不会出现"。 ... PC版: 手机版:

封面图片

英国安全研究所发布人工智能模型安全性测试工具

英国安全研究所发布人工智能模型安全性测试工具 在周五宣布这一消息的新闻稿中,安全研究所声称,Inspect 标志着"由国家支持的机构主导的人工智能安全测试平台首次被广泛使用"。安全研究所主席伊恩-霍加斯(Ian Hogarth)在一份声明中说:"人工智能安全测试方面的成功合作意味着要有一个共享的、可访问的评估方法,我们希望Inspect能够成为一个基石。我们希望看到全球人工智能社区利用Inspect不仅开展自己的模型安全性测试,而且帮助调整和构建开源平台,以便我们能够全面开展高质量的评估。"众所周知,人工智能基准很难制定其中最重要的原因是,当今最复杂的人工智能模型几乎都是黑盒,其基础设施、训练数据和其他关键细节都被创建这些模型的公司保密。那么,Inspect 如何应对这一挑战呢?主要是通过可扩展的新测试技术。Inspect 由三个基本部分组成:数据集、求解器和评分器。数据集为评估测试提供样本。求解器负责执行测试。评分器负责评估求解器的工作,并将测试得分汇总为指标。可以通过用 Python 编写的第三方软件包来增强 Inspect 的内置组件。Mozilla 研究员、著名人工智能伦理学家德博拉-拉吉(Deborah Raj)在 X 上发表了一篇文章,称 Inspect "证明了对人工智能问责开源工具的公共投资的力量"。人工智能初创公司Hugging Face的首席执行官克莱门特-德朗格(Clément Delangue)提出了将Inspect与Hugging Face的模型库整合在一起,或利用工具集的评估结果创建一个公共排行榜的想法。Inspect 发布之前,美国政府机构国家标准与技术研究院(NIST)启动了NIST GenAI,该计划旨在评估各种生成式人工智能技术,包括文本和图像生成人工智能。NIST GenAI 计划发布基准,帮助创建内容真实性检测系统,并鼓励开发能识别虚假或误导性人工智能生成信息的软件。今年 4 月,美国和英国宣布建立合作伙伴关系,共同开发先进的人工智能模型测试,这是继去年 11 月英国在布莱切利公园举行的人工智能安全峰会上宣布承诺之后的又一合作。作为合作的一部分,美国打算成立自己的人工智能安全研究所,广泛负责评估人工智能和生成式人工智能的风险。 ... PC版: 手机版:

封面图片

调查:中国在生成式人工智能应用方面全球第一

调查:中国在生成式人工智能应用方面全球第一 根据美国人工智能和分析软件公司SAS以及Coleman Parkes Research对全球各行业1600名决策者进行的调查,83%的中国受访者表示他们已采用了生成式人工智能。这一比例远高于参与调查的其他16个国家和地区的平均水平(54%)。紧随中国之后的英国和美国,在这两个国家中70%和65%的受访者表示他们已经采用了生成式人工智能。SAS指出,此份调查的受访行业包括了银行、保险、医疗保健、电信、制造、零售和能源等。接受调查的最小企业和组织也雇用了500至999名员工,大型组织雇用了超过10000名员工。自ChatGPT发布之后,GenAI领域的发展势头迅猛,目前已有数十家中国公司推出了自身的聊天机器人版本。上周,联合国世界知识产权组织的一份报告也显示,中国在GenAI专利竞赛中处于领先地位,2014年至2023年间,中国的生成式人工智能发明超过3.8万件,是排名第二的美国的6倍之多。虽然包括OpenAI在内的一些国际领先的生成式人工智能服务提供商,目前对中国地区的使用施以限制,但中国已发展出一个强大的本地生成式人工智能产业,从字节跳动等科技巨头到智谱等初创企业都提供了相关AI服务。由于价格战可能进一步降低企业大型语言模型服务的成本,未来中国企业采用生成式人工智能的速度还有望进一步加快。调查还显示,受访的每10个组织中只有1个已做好遵守GenAI法规所需的准备工作。95%的企业缺乏全面的GenAI治理框架。只有不到十分之一的组织(7%)提供了高水平的GenAI治理和监控培训。值得一提的是,在生成式AI的法规建设和安全监控方面,中国同样位居全球第一。不过,Coleman Parkes董事总经理Stephen Saw也表示,尽管中国在GenAI采用率方面可能处于领先地位,但采用率更高并不一定意味着实施效果更好或回报更高。事实上,美国在GenAI的竞争中可能仍要略占上风,24%的美国企业和组织已全面实施了GenAI(将生成式AI与现有业务流程进行整合使用),而中国这一比例仅为19%。调查报告还提到,按行业划分,TMT、零售、保险、银行和生命科学等领域目前在GenAI的应用方面处于领先位置。制造业、公共部门和医疗保健等领域则相对落后。                                     ... PC版: 手机版:

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人