Cloudflare 称赞 Golang PGO 大幅节省 CPU 资源

Cloudflare 称赞 Golang PGO 大幅节省 CPU 资源 访问:NordVPN 立减 75% + 外加 3 个月时长 另有NordPass密码管理器 编译器的PGO支持非常好,前提是有足够多的样本作为配置文件反馈给编译器,这样编译器就能对代码进行适当的优化。编译器可以根据收集到的配置文件/反馈做出更明智的优化,但与更容易应用的编译器优化相比,这确实需要额外的步骤。就 Golang 的 PGO 而言,某些代码库的改进幅度可高达 14%。Cloudflare 拥有一些基于 Go 的服务,这些服务依赖于全球成千上万的 CPU 核心,因此他们最近开始探索 Golang 的 PGO 对其基础架构的影响。结果如下这表明,在发布之后,我们使用的内核比发布之前少了约 97 个,减少了约 3.5%。这似乎与上游文档中给出的 2% 到 14% 之间的数字相符。我们可以感受到的的第二个数字是一周内不同天同一时间的使用率。发布前 7 天的平均使用率为 3067.83 个内核,而发布后 7 天的平均使用率为 2996.78 个内核,节省了 71 个 CPU。虽然比不上我们节省的 97 个 CPU,但也相当可观了!这似乎证明了 PGO 的好处在完全不改变代码的情况下,我们成功地为自己节省了几台服务器的 CPU 计算时间。考虑到当今的服务器成本以及总拥有成本(包括能源和冷却成本),节省几台服务器的 CPU 时间意义重大,这是以最少的投资实现的效率提升。今后,他们还将探索更多的剖析,通过 BOLT 或 LTO 优化和其他调整进一步优化。更多详情请访问Cloudflare 博客。 ... PC版: 手机版:

相关推荐

封面图片

Golang 编译器代码浅析

Golang 编译器代码浅析 本书主要目的是让读者在源码层面熟悉 Go 编译器的实现,因此会以代码讲解为主。但编译器的实现涉及到非常多的细节处理,本文会尽量避免大段的贴代码来对其进行分析(实际上也是不可行的),而是建议读者将文章当着一个参考,自己动手去源码中进行探索。因此每个主题的文章基本会按照如下结构进行组织: 1. 该模块的简介,需要涉及到的理论知识复习。例如词法、语法分析中涉及到很多形式语言与自动机的知识,文章都会先尽可能少地温习一下相关知识 2. 核心数据结构介绍,意在搭建该模块的骨架 3. 核心逻辑介绍,意在了解该模块实现的主体算法思路 4. 特殊案例分析,详细分析典型案例的处理流程 另外作者还开了两个坑《Linux核心概念详解》和《极简计算机结构介绍》,也写了一些内容不过还不太完整。

封面图片

[email protected]

[email protected]》 简介:一款专注于实时监测与优化设备性能的工具类应用,提供详细的CPU运行状态、温度、频率及使用率等核心数据,帮助用户掌握硬件负载情况并提升系统效率。 亮点:支持多维度硬件信息可视化,具备低耗能实时监控和异常预警功能,界面简洁直观,适合科技爱好者及普通用户快速了解设备健康状况。 标签: #设备监控#性能优化#系统工具#硬件信息#CPU优化#实时检测#iOS应用 更新日期:2025-04-25 10:56:00 链接:https://pan.quark.cn/s/1e631b3fd560

封面图片

Steam在Linux上的使用率持续增加:接近 2% AMD CPU使用率达到72%

Steam在Linux上的使用率持续增加:接近 2% AMD CPU使用率达到72% 2024 年 1 月,Steam Linux 的使用率为1.95%,而此前几个月一直在 1.9% 左右。但在 2 月份,Steam Linux 的使用率下降了 0.19%,市场份额为 1.76%。不过,简体中文的使用率飙升了 7.6%,这与之前的 Steam 调查结果相吻合。今天晚上,三月份的数据已经出炉,Linux 的使用率为 1.94%,比二月份提高了 0.19%,与一月份的 1.95% 相差无几。Windows 为 96.67%,macOS 为 1.38%。3 月份的结果显示,中文使用率没有下降,反而上升了 0.59%,而英文使用率则比上月上升了 0.42%:简体中文用户占 33.43%,英文用户占 32.54%,俄语玩家占 8.36%。在 Linux 用户中,Steam Deck 使用的 Valve SteamOS Holo 平台占 44.22%,比前一个月增加了 0.67%。在 Linux 游戏玩家中,AMD CPU 的使用又增长了 0.61%,市场份额达到 72.10%,而英特尔则为 27.9%。Steam Deck 使用的是定制的 AMD APU,这在一定程度上提高了 AMD Linux CPU 的使用率。对于 Steam 上的 Windows 玩家,英特尔 3 月份的市场份额为 68.74%。由于 Steam Deck 使用集成的 Radeon 显卡,而且 AMD Radeon 显卡因其良好的开源和上游驱动程序支持而广受欢迎,因此 AMD GPU 在 Linux 玩家的 Steam 平台上继续占据主导地位。在 Windows 下,GeForce RTX 3060 仍然是最常用的显卡。如果您想全面了解 2024 年 3 月的 Steam上找到所有新数据。 ... PC版: 手机版:

封面图片

Meta发布LLM编译器 称将改变我们的编程方式

Meta发布LLM编译器 称将改变我们的编程方式 在将大型语言模型应用于代码和编译器优化方面,LLM 编译器背后的研究人员解决了一个尚未充分探索的重大空白。通过在包含 5460 亿条LLVM-IR和汇编代码的海量语料库上训练模型,他们使模型能够理解编译器中间表示、汇编语言和优化技术。研究人员在论文中解释说:"LLM 编译器增强了对编译器中间表征(IR)、汇编语言和优化技术的理解。这种增强的理解能力使该模型能够执行以前由人类专家或专用工具完成的任务。"LLM 编译器在代码大小优化方面取得了显著成果。在测试中,该模型的优化潜力达到了自动调整搜索的 77%,这一结果可以显著缩短编译时间,提高各种应用的代码效率。事实证明,该模型的反汇编能力更令人印象深刻。在将 x86_64 和 ARM 汇编转换回 LLVM-IR 时,LLM 编译器显示了 45% 的往返反汇编成功率(14% 精确匹配)。这种能力对于逆向工程任务和遗留代码维护来说非常宝贵。了解更多: Cummins)强调了这项技术的潜在影响:他说:"通过提供两种规模(70 亿个参数和 130 亿个参数)的预训练模型,并通过微调版本展示其有效性,LLM 编译器为探索 LLM 在代码和编译器优化领域尚未开发的潜力铺平了道路。"这项技术的影响深远而广泛。软件开发人员可以受益于更快的编译时间、更高效的代码以及用于理解和优化复杂系统的新工具。研究人员获得了探索人工智能驱动的编译器优化的新途径,有可能在软件开发方法上实现突破。特别值得一提的是,Meta 决定以许可商业授权的方式发布 LLM 编译器。此举使学术研究人员和行业从业人员都能利用和改造这项技术,从而有可能加速该领域的创新。然而,如此强大的人工智能模型的发布也引发了人们对软件开发不断变化的格局的质疑。随着人工智能处理复杂编程任务的能力越来越强,它可能会重塑未来软件工程师和编译器设计师所需的技能。LLM 编译器代表的不仅仅是一种渐进式改进,而是我们在处理编译器技术和代码优化方面的根本性转变。通过这一版本,Meta 向学术界和工业界提出了挑战,以推动人工智能辅助编程的发展。随着人工智能驱动的代码优化领域的不断发展,全球开发人员和研究人员如何采用、调整和改进这一开创性技术,将是一个引人入胜的话题。 ... PC版: 手机版:

封面图片

Google Chrome将尝试卸载音频引用以节省Windows的用电量

Google Chrome将尝试卸载音频引用以节省Windows的用电量 6 月 14 日的提交页面上发现出现了音频卸载功能的蛛丝马迹。该页面暗示了一项不会强制"对非播放流进行音频卸载"的功能。从那里,我们偶然发现了另一个提交页面,该页面声称将"在 Windows 上添加音频卸载实验"。Chromium 卸载音频引用卸载音频的想法并不新鲜。微软在 2019 年首次提出了这一问题,其基本目的是通过让硬件的音频处理器来处理音频,从而降低 CPU 的使用率。例如,在播放视频时,Chrome 浏览器将使用音频处理器来处理音频请求。目前,音频进程由 CPU 处理,但随着音频卸载功能的推出,情况会有所改变。Windows 支持"硬件卸载音频处理",当您增大缓冲区大小时,CPU 可以更长时间地处于空闲状态。由于采用了音频卸载技术,在 Chrome 浏览器中播放音频时,CPU 使用率会降低。这还能节省二合一设备和笔记本电脑的电池。不过,仅集成音频卸载功能还不够,还需要配备音频处理器的设备。一段时间以来,Google、微软和英特尔一直在开发音频卸载功能,现在看来,这项功能已经准备就绪。您可以在 Chrome Canary 中打开一个名为"视频流音频卸载"的标记来处理该功能。这只会在延迟标签设置为 kPlayback 的流媒体中启用该标记背后的音频卸载功能。对于其他延迟类型,音频卸载将始终处于禁用状态。在我们的测试中,当 通过命令行打开该功能时,我们注意到默认缓冲时间为 50 毫秒。Google警告说:"音频卸载要求音频服务处于低完整性级别,因此使用 Chromium 的其他用户在开启该功能时应确保音频服务处于沙盒状态。"目前,该功能仍处于实验阶段,没有提及发布时间表。由于 Edge 使用的是相同的 Chromium 引擎,微软极有可能为其开发类似的功能。在 Edge 加入睡眠标签页功能以减少内存浪费之后,Chrome 浏览器也加入了内存节省功能,从非活动标签页中释放内存。此外,Chrome 浏览器还具有节能功能,在设备电量很低时非常有用。Edge 中有大量的性能管理设置,浏览器中甚至还有性能检测器。鉴于 Chrome 浏览器令人瞠目的市场份额,Edge 的市场份额正在慢慢扩大,这一点值得称赞。 ... PC版: 手机版:

封面图片

"开源 Windows"ReactOS在支持SMP CPU方面进展顺利

"开源 Windows"ReactOS在支持SMP CPU方面进展顺利 最令人兴奋的是,ReactOS 新闻通讯更新中出现了大量围绕 SMP 支持的活动,以更好地处理现代多核处理器。由于一位开发人员的努力,ReactOS 的对称多处理(SMP)支持得到了"广泛改进"。现在,它支持处理器冻结和切换、对处理器间中断(IPI)的基本支持、调试以及其他与 SMP 相关的增强功能。虽然 ReactOS 最近为更好地处理现代多核 CPU 而开展了大量 SMP 工作,但状态更新指出:"值得注意的是,SMP 并不支持多核 CPU:"值得注意的是,SMP 仍在大量开发中,目前还无法准确估计何时才能最终支持多核,因此请继续关注更多更新!"ReactOS 在编译和运行 GCC 13 编译器构建的环境方面也取得了进展。为了更新组装 ReactOS 的 GCC 编译器工具链,GCC 13 的工作正在进行中。ReactOS 还在努力更新 Wine 项目中使用的用户模式模块。这样一来,依赖于更新后 Wine 模块的新 ReactOS 版本就能更好地兼容应用程序。此外,ReactOS 还在异步网络连接支持、音频改进、新的 ATA 存储驱动程序和其他方面进行了改进。此外,还有新的开发人员开始为 ReactOS 软件项目做出贡献,帮助完成新的任务。有关 ReactOS 操作系统最新改进的更多详情,请参阅ReactOS 新闻通讯。 ... PC版: 手机版:

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人