Meta工程师使用BOLT优化Linux内核 成功榨取5%性能

Meta工程师使用BOLT优化Linux内核 成功榨取5%性能 目前,使用 BOLT 优化 Linux 内核的性能比默认性能提高约 5%。特定工作负载的性能收益最终取决于应用程序在内核空间中花费的时间,数据库服务器、其他网络密集型工作负载等的收益要高于用户空间任务。上周,Meta 工程师马克西姆-潘琴科(Maksim Panchenko)提交了一份 Linux 内核优化指南,供希望构建内核映像并使用 BOLT 对其进行优化的用户参考。在该指南中,对特定性能优势的解释是"通过改进代码布局,BOLT 可以减少指令缓存缺失和分支错误预测,从而将内核性能最多提高 5%。在衡量系统总体性能时,应根据应用程序在内核中花费的时间(不包括 I/O 时间)相应地调整这一数字"。如需使用 BOLT 优化 Linux 内核,请参阅新指南。 ... PC版: 手机版:

相关推荐

封面图片

Meta正在招募芯片工程师以开发下一代AI和ML专用加速器

Meta正在招募芯片工程师以开发下一代AI和ML专用加速器 根据最近在网上发布的招聘信息,Meta 公司希望招聘高技能的硬件工程师来开发新一代专用集成电路(ASIC)设计。ASIC 芯片在硬件层面为特定的计算用途而定制,这意味着它们不像传统 CPU 那样用于通用用途。但是,ASIC 在其设计用途上也非常高效,例如为人工智能工作负载和聊天机器人服务提供机器学习算法。Meta公司最新招聘职位分布在印度班加罗尔和加利福尼亚桑尼维尔。在印度,Facebook 母公司正在招聘一名ASIC 工程师,为其数据中心构建硬件加速器。招聘信息称,这名新员工将成为 ASIC 团队不可或缺的一员,该团队致力于开发最先进的芯片架构,以加速人工智能/机器学习算法。尽管人工智能应用对能源的需求巨大,但 Meta 仍希望打造"绿色"数据中心加速器。新任 ASIC 工程师需要开发新的先进硬件架构和算法,以支持和测试这些新芯片。该职位的职责包括开发性能和功能模型以验证新架构,创建机器学习内核以分析 ASIC 芯片,以及针对 ML 工作负载优化架构。Facebook 公司正在寻找至少拥有计算机科学或工程学士学位、10 年以上工作经验并了解处理器、内存系统和片上互连网络等计算机架构概念的人才。应聘者还需要在 C++(和 C)等低级面向对象编程语言方面有丰富的经验。Meta的一些与ASIC架构相关的招聘信息最早是在2023年12月发布的,但两周前又重新发布了。该公司此前曾表示,希望开发自己的"推理加速器",并将于 2024 年上线。据 NVIDIA 首席执行官黄仁勋(Jensen Huang)称,GPU 在改善 Meta 的"推荐引擎"和公司整体收入方面发挥了关键作用。但 NVIDIA 也表示,在不久的将来,它很可能无法为任何从事人工智能业务的人提供足够的 GPU 加速器。Meta 似乎也在研究人工通用智能 (AGI)这一难以捉摸的概念,这对于最新的 GPU 技术来说是一项极其艰巨的任务,但对于专用的 ASIC 芯片设计来说,却能从中获益匪浅。 ... PC版: 手机版:

封面图片

Linux 6.8 网络优化可将大量并发连接下的 TCP 性能提高约 40%

Linux 6.8 网络优化可将大量并发连接下的 TCP 性能提高约 40% 据 Phoronix 报道,Linux 6.8 内核对核心网络代码进行了一些关键改进,在遇到大量并发网络连接时,可将 TCP 性能可提高约40%。首先,对核心网络结构进行了分析和重组。这项工作的重点是优化缓存行消耗并添加保护措施以确保未来的更改不会倒退。反过来,这种核心网络结构的优化使大量并发连接的 TCP 性能提高了40%或更多。 目前,网络堆栈中的大量变量结构是按时间顺序、逻辑顺序组织的,有时还按缓存行访问进行组织。新的补丁系列尝试重新组织核心网络堆栈变量,以最大限度地减少数据传输阶段的缓存行消耗。具体来说,来自谷歌的开发人员研究了 TCP/IP 堆栈和 TCP 中的快速路径定义。

封面图片

Rocky Linux 将支持上游稳定内核

Rocky Linux 将支持上游稳定内核 CIQ 本周宣布,他们将在 Rocky Linux 中支持上游稳定内核。他们在一份新闻稿中写道:CIQ 的新产品是为满足最先进客户对超高性能、兼容性和安全性的需求而开发的,现在所有人都可以使用。新产品的开发源于一个存储用例,在该用例中,利用 AMD EPYC 处理器的大 PCIe 基底面至关重要。从那时起,随着企业意识到上游内核的优势,更多的用例也随之出现。遗憾的是,关于他们在 Rocky Linux 上的上游内核支持计划,目前还没有太多公开信息。此外,Rocky Linux 上的上游内核似乎可能只面向其商业客户,而不是免费提供所有资产,只提供商业支持。无论如何,看到Rocky Linux支持上游内核的选择,对于那些想享受最新的上游创新、性能改进和新硬件支持的人来说是件好事。毕竟性能和速度、更广泛的硬件兼容性和安全性是人们对 Rocky Linux 上游内核支持感兴趣的原因。 ... PC版: 手机版:

封面图片

60秒完成Linux系统的性能分析 ||

60秒完成Linux系统的性能分析 || 原文出自Netflix技术团队的博客。 在本文中,Netflix性能工程团队将使用您应该使用的标准Linux工具在命令行中向你展示一个性能诊断过程的前60秒。在60秒内,可以通过运行图中十个命令来了解有关系统资源使用和运行进程的信息。 最应该关注的是一些很容易理解的错误、饱和度指标和资源利用率等指标。饱和度是衡量资源负载超出其处理能力的指标,它可以通过观察请求队列的长度或等待时间反映出来。

封面图片

提议中的Linux的动态内核堆栈功能补丁可节省大量内存

提议中的Linux的动态内核堆栈功能补丁可节省大量内存 Google一直在使用内核补丁来保持 8K 堆栈,但随着时间的推移,他们需要更大的堆栈大小,这反过来又增加了超大规模部署的内存使用量。为了减少增加的内存使用,Google一直在研究动态内核堆栈,因为许多内核线程都可以容纳在 4K 或 8K 的堆栈中。到目前为止,动态内核堆栈的 RFC 补丁工作进展顺利,已经进行了少量测试,并允许从 4K 扩展到 THREAD_SIZE 限制。Google工程师发现,动态内核堆栈平均可以节省 70% 到 75% 的内核堆栈内存。Pasha Tatashin 发布的早期结果很有希望,但可能取决于工作负载、虚拟化和其他因素:Tatashin 进一步补充说:"一些拥有数百万线程的工作负载可以从这一功能中显著受益。"对节省内核堆栈内存这项工作感兴趣的人,请参阅RFC 补丁系列。 ... PC版: 手机版:

封面图片

MangoHud 是一款专为 Linux 系统设计的高性能监控工具,它通过 Vulkan 和 OpenGL 叠加层技术,为用户提

MangoHud 是一款专为 Linux 系统设计的高性能监控工具,它通过 Vulkan 和 OpenGL 叠加层技术,为用户提供了实时监控 FPS(每秒帧数)、系统温度、CPU 和 GPU 负载等功能。该工具特别适合游戏玩家和性能调优爱好者使用,帮助他们更好地了解和优化系统性能。 ### 功能特点 - **实时监控**:MangoHud 可以实时显示 FPS、CPU 和 GPU 温度、负载等关键性能指标。 - **高度可配置**:用户可以通过配置文件调整显示的信息、位置和样式。 - **环境变量支持**:通过环境变量,用户可以快速调整配置,而无需编辑配置文件。 - **Vsync 设置**:支持对 OpenGL 和 Vulkan 应用程序的垂直同步(Vsync)进行设置,以优化游戏体验。 - **日志记录**:MangoHud 支持记录 FPS 日志,用户可以将日志上传到进行在线可视化,或使用 mangoplot 工具进行本地分析。 ### 使用场景 MangoHud 适用于需要监控系统性能的多种场景,如游戏、视频播放、渲染任务等。它可以帮助用户发现性能瓶颈,调整系统设置,以获得更流畅的体验。 ### 注意事项 - MangoHud 目前不支持 Windows 操作系统。Windows 用户可能需要寻找其他类似的性能监控工具。 - 在使用 MangoHud 时,确保遵循仓库中的指南,正确安装所有依赖项,以避免兼容性问题。 - 对于高级用户,MangoHud 提供了丰富的配置选项,可以深入定制监控体验。 总结来说,MangoHud 是一款强大的 Linux 系统性能监控工具,它通过提供实时的 FPS 和硬件状态监控,帮助用户优化系统性能。虽然它不支持 Windows 系统,但对于 Linux 用户来说,这是一个非常有价值的工具。

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人