苹果发布人工智能模型MGIE 可根据自然语言输入编辑图片

苹果发布人工智能模型MGIE可根据自然语言输入编辑图片该模型能够编辑图像的各个方面。全局照片增强可包括亮度、对比度或锐利度，或应用素描等艺术效果。局部编辑可以修改图像中特定区域或对象的形状、大小、颜色或纹理，而Photoshop风格的修改则包括裁剪、调整大小、旋转和添加滤镜，甚至是更改背景和混合图像。用户对一张披萨照片的输入可能是"让它看起来更健康"。利用常识推理，模型可以添加蔬菜配料，如西红柿和香草。全局优化输入请求的形式可以是"增加对比度，模拟更多光线"，而Photoshop风格的修改可以是要求模型将人物从照片背景中移除，将图像的焦点转移到拍摄对象的面部表情上。苹果公司与加州大学的研究人员合作创建了MGIE，并在2024年国际学习表征会议（ICLR）上发表了一篇论文。该模型可在GitHub上获取，包括代码、数据和预训练模型。这是苹果公司几个月来在人工智能研究领域取得的第二次突破。12月底，苹果公司透露，通过发明一种创新的闪存利用技术，它在iPhone和其他内存有限的苹果设备上部署大型语言模型(LLM)方面取得了长足进步。在过去的几个月里，苹果一直在测试一种可以与ChatGPT竞争的"AppleGPT"。据彭博社的马克-古尔曼（MarkGurman）称，人工智能工作是苹果公司的一个优先事项，该公司正在为大型语言模型设计一个"Ajax"框架。TheInformation和分析师杰夫-普（JeffPu）都声称，苹果将在2024年底左右在iPhone和iPad上推出某种生成式人工智能功能，也就是iOS18上市的时候。据古尔曼称，iOS18据说将包括一个增强版Siri，具有类似ChatGPT的生成式人工智能功能，并有可能成为iPhone历史上"最大的"软件更新。...PC版：https://www.cnbeta.com.tw/articles/soft/1416801.htm手机版：https://m.cnbeta.com.tw/view/1416801.htm

在Telegram中查看

相关推荐

古尔曼：苹果致力于开发用于生成式人工智能功能的设备端大型语言模型

古尔曼：苹果致力于开发用于生成式人工智能功能的设备端大型语言模型据彭博社的马克·古尔曼报道，苹果公司正在开发自己的大型语言模型(LLM)，该模型可在设备上运行，以优先考虑速度和隐私。古尔曼在他的“PowerOn”时事通讯中写道，苹果公司的大语言模型为即将推出的生成式人工智能功能奠定了基础。“所有迹象”似乎表明，它将完全在设备上运行，而不是像大多数现有人工智能服务那样通过云端运行。由于苹果公司的人工智能工具将在设备上运行，因此在某些情况下，可能不如直接基于云的竞争对手，但古尔曼表示，该公司可以通过从谷歌和其他人工智能服务提供商获得技术许可来“填补空白”。——

Shutterstock授权苹果公司使用数百万张图片来训练其人工智能模型

Shutterstock授权苹果公司使用数百万张图片来训练其人工智能模型此前曾有消息称，苹果公司与多家出版商就类似的人工智能大型语言模型(LLM)培训进行了谈判，并使用了来自新闻文章的内容。据称，CondeNastIAC和NBC等大型媒体都曾与苹果公司洽谈过内容授权事宜。预计苹果公司将在今年6月的WWDC大会上宣布一些重大消息，努力在其操作系统中加入更多人工智能技术。虽然在人工智能整合方面，苹果经常被认为落后于竞争对手，但它自己也进行了一些创新。在过去的一年里，苹果设备用户可能已经注意到了苹果"机器学习"技术的微小改进。例如，预测文本在适应特定用户偏好的词汇方面变得越来越准确，Siri翻译常用短语的能力也得到了提高。据传，苹果公司的下一代处理器将包含更强大的神经引擎。苹果公司全球营销高级副总裁格雷格-乔斯维克（GregJoswiak）在社交媒体上调侃说，下一届WWDC大会将是"绝对令人难以置信的"，暗示这次大会将主要围绕iOS18和其他苹果操作系统中新增的人工智能类型功能展开。苹果在使用人工智能技术方面面临的最大挑战是维持其用户隐私标准，而其他大型人工智能技术公司并不关心这个问题。苹果公司最近透露，它打算开发可以尽可能使用本地设备算力的模型。...PC版：https://www.cnbeta.com.tw/articles/soft/1426405.htm手机版：https://m.cnbeta.com.tw/view/1426405.htm

苹果公司寻求Photobucket数十亿张图片的授权以训练人工智能模型

苹果公司寻求Photobucket数十亿张图片的授权以训练人工智能模型生成式人工智能的兴起刺激了对多样化数据集的需求，而像Photobucket这样的公司能够提供大量的视觉数据，训练人工智能根据文本提示生成内容。在ChatGPT于2022年底推出后不久，苹果公司就与Shutterstock达成了数百万张图片的授权协议，据信这笔交易的价值在2500万美元到5000万美元之间。追求"道德来源"和合法明确的数据，标志着苹果与早先随意采集网络数据的做法不同。据报道，苹果公司准备在6月份的WWDC大会上展示iOS18及其他主要软件更新所带来的一系列人工智能功能。相关文章:Shutterstock授权苹果公司使用数百万张图片来训练其人工智能模型...PC版：https://www.cnbeta.com.tw/articles/soft/1426645.htm手机版：https://m.cnbeta.com.tw/view/1426645.htm

Google人工智能技术“Transframer”可根据一张图片创建短视频

Google人工智能技术“Transframer”可根据一张图片创建短视频随着技术的发展，研究人员继续寻找新的方法来利用人工智能和机器学习能力。本周早些时候，Google科学家宣布创建了Transframer，这是一个新的框架，它能根据单一的图像输入来生成短视频。这项新技术有朝一日可以增强传统的渲染解决方案并使开发者能够基于机器学习能力创建虚拟环境。这个新框架的名称（及在某些方面的概念）是对另一个基于人工智能的模型Transformer的点赞。Transformer最初于2017年推出，是一个新颖的神经网络架构，它有能力通过建模和比较句子中的其他词来生成文本。此后，该模型被纳入了标准的深度学习框架如TensorFlow和PyTorch。据悉，Transframer使用具有类似属性的背景图像，结合查询注释来创建短视频。尽管在原始图像输入中没有提供任何几何数据，但产生的视频在目标图像周围移动并将准确的视角可视化。这项新技术使用Google的DeepMind人工智能平台进行了演示，其功能是分析单一的照片背景图像以此来获得关键的图像数据并生成额外的图像。在这一分析过程中，系统确定了图片的框架，这反过来又帮助系统预测图片的周围环境。然后，语境图像被用来进一步预测图片从不同角度会出现的情况。预测根据数据、注释及语境框架中的任何其他信息对额外图像框架的概率进行建模。该框架通过提供基于非常有限的数据集生成合理准确的视频的能力，这标志着视频技术的巨大进步。Transframer任务在其他跟视频有关的任务和基准上也显示出极有前景的结果，如语义分割、图像分类和光流预测。对基于视频的行业如游戏开发可能具有潜在的巨大影响。目前的游戏开发环境依赖于核心渲染技术，如着色、纹理映射、景深和光线追踪。像Transframer这样的技术有可能通过使用人工智能和机器学习来构建他们的环境并与此同时来减少创建环境所需的时间、资源和精力以为开发者提供一个全新的开发路径。PC版：https://www.cnbeta.com/articles/soft/1306793.htm手机版：https://m.cnbeta.com/view/1306793.htm

人工智能公司正在转向“小型”语言模型以获利

人工智能公司正在转向“小型”语言模型以获利投入数十亿美元构建所谓的大型语言模型以推动生成式人工智能产品的人工智能公司，现在正寄望于一种新的收入增长方式：小型语言模型。苹果、微软、Meta和谷歌最近都发布了新的人工智能模型，这些模型的“参数”较少，但功能仍然强大。通常来说，参数的数量越多，人工智能软件的性能就越好，能处理的任务也就越复杂和微妙。本周公布的OpenAI的最新模型GPT-4o和谷歌的Gemini1.5Pro，据估计都拥有超过1万亿个参数。而Meta正在训练其开源Llama模型的4000亿参数版本。除了努力说服一些企业客户支付运行生成式人工智能产品所需的大额费用外，对数据和版权责任的担忧也阻碍了其广泛应用。这促使像Meta和谷歌这样的科技集团推出只有几十亿参数的小型语言模型，作为更经济、更节能、可定制的替代方案，这些模型在训练和运行时所需的电力更少，同时还能保护敏感数据。——

英国安全研究所发布人工智能模型安全性测试工具

英国安全研究所发布人工智能模型安全性测试工具在周五宣布这一消息的新闻稿中，安全研究所声称，Inspect标志着"由国家支持的机构主导的人工智能安全测试平台首次被广泛使用"。安全研究所主席伊恩-霍加斯（IanHogarth）在一份声明中说："人工智能安全测试方面的成功合作意味着要有一个共享的、可访问的评估方法，我们希望Inspect能够成为一个基石。我们希望看到全球人工智能社区利用Inspect不仅开展自己的模型安全性测试，而且帮助调整和构建开源平台，以便我们能够全面开展高质量的评估。"众所周知，人工智能基准很难制定--其中最重要的原因是，当今最复杂的人工智能模型几乎都是黑盒，其基础设施、训练数据和其他关键细节都被创建这些模型的公司保密。那么，Inspect如何应对这一挑战呢？主要是通过可扩展的新测试技术。Inspect由三个基本部分组成：数据集、求解器和评分器。数据集为评估测试提供样本。求解器负责执行测试。评分器负责评估求解器的工作，并将测试得分汇总为指标。可以通过用Python编写的第三方软件包来增强Inspect的内置组件。Mozilla研究员、著名人工智能伦理学家德博拉-拉吉（DeborahRaj）在X上发表了一篇文章，称Inspect"证明了对人工智能问责开源工具的公共投资的力量"。人工智能初创公司HuggingFace的首席执行官克莱门特-德朗格（ClémentDelangue）提出了将Inspect与HuggingFace的模型库整合在一起，或利用工具集的评估结果创建一个公共排行榜的想法。Inspect发布之前，美国政府机构--国家标准与技术研究院（NIST）启动了NISTGenAI，该计划旨在评估各种生成式人工智能技术，包括文本和图像生成人工智能。NISTGenAI计划发布基准，帮助创建内容真实性检测系统，并鼓励开发能识别虚假或误导性人工智能生成信息的软件。今年4月，美国和英国宣布建立合作伙伴关系，共同开发先进的人工智能模型测试，这是继去年11月英国在布莱切利公园举行的人工智能安全峰会上宣布承诺之后的又一合作。作为合作的一部分，美国打算成立自己的人工智能安全研究所，广泛负责评估人工智能和生成式人工智能的风险。...PC版：https://www.cnbeta.com.tw/articles/soft/1430544.htm手机版：https://m.cnbeta.com.tw/view/1430544.htm

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人