Meta工程师使用BOLT优化Linux内核 成功榨取5%性能

Meta工程师使用BOLT优化Linux内核 成功榨取5%性能 目前,使用 BOLT 优化 Linux 内核的性能比默认性能提高约 5%。特定工作负载的性能收益最终取决于应用程序在内核空间中花费的时间,数据库服务器、其他网络密集型工作负载等的收益要高于用户空间任务。上周,Meta 工程师马克西姆-潘琴科(Maksim Panchenko)提交了一份 Linux 内核优化指南,供希望构建内核映像并使用 BOLT 对其进行优化的用户参考。在该指南中,对特定性能优势的解释是"通过改进代码布局,BOLT 可以减少指令缓存缺失和分支错误预测,从而将内核性能最多提高 5%。在衡量系统总体性能时,应根据应用程序在内核中花费的时间(不包括 I/O 时间)相应地调整这一数字"。如需使用 BOLT 优化 Linux 内核,请参阅新指南。 ... PC版: 手机版:

相关推荐

封面图片

猿来教育-Linux云计算SRE工程师

猿来教育-Linux云计算SRE工程师 描述:猿来教育的Linux云计算SRE工程师培训专注于培养系统运维人才。课程涵盖从零基础到精通的全过程,包括系统稳定性建设、自动化运维、性能优化等内容。培训具有市场需求大、就业前景好的特点,据统计,云计算SRE岗位数量持续增长,一线城市月薪范围在25~50k。适合应届生、转行人员及在职提升者学习。 链接:https://pan.quark.cn/s/679074d37ff7 大小:73.3GB 标签:#教程 #Linux #工程师 #猿来教育 #quark 频道:@yunpanshare 群组:@yunpangroup

封面图片

处理加沙信息遭解雇 前工程师起诉META

处理加沙信息遭解雇 前工程师起诉META 当地时间6月4日,巴勒斯坦裔美国工程师费拉斯·哈马德在加州起诉 Meta 公司在处理与加沙战争相关的信息内容时存在偏见,并在诉讼中声称 Meta 公司因他试图帮助修复导致巴勒斯坦 Instagram 帖子被限流的错误而解雇了他。该工程师自2021年以来一直在 Meta 机器学习团队工作,但在2月遭解雇。在诉状中,费拉斯·哈马德还指责 Meta 对巴勒斯坦人存在偏见,称该公司删除了提及其亲属在加沙死亡的员工内部通讯,并对他们使用巴勒斯坦国旗表情符号的情况进行了调查。

封面图片

Meta正在招募芯片工程师以开发下一代AI和ML专用加速器

Meta正在招募芯片工程师以开发下一代AI和ML专用加速器 根据最近在网上发布的招聘信息,Meta 公司希望招聘高技能的硬件工程师来开发新一代专用集成电路(ASIC)设计。ASIC 芯片在硬件层面为特定的计算用途而定制,这意味着它们不像传统 CPU 那样用于通用用途。但是,ASIC 在其设计用途上也非常高效,例如为人工智能工作负载和聊天机器人服务提供机器学习算法。Meta公司最新招聘职位分布在印度班加罗尔和加利福尼亚桑尼维尔。在印度,Facebook 母公司正在招聘一名ASIC 工程师,为其数据中心构建硬件加速器。招聘信息称,这名新员工将成为 ASIC 团队不可或缺的一员,该团队致力于开发最先进的芯片架构,以加速人工智能/机器学习算法。尽管人工智能应用对能源的需求巨大,但 Meta 仍希望打造"绿色"数据中心加速器。新任 ASIC 工程师需要开发新的先进硬件架构和算法,以支持和测试这些新芯片。该职位的职责包括开发性能和功能模型以验证新架构,创建机器学习内核以分析 ASIC 芯片,以及针对 ML 工作负载优化架构。Facebook 公司正在寻找至少拥有计算机科学或工程学士学位、10 年以上工作经验并了解处理器、内存系统和片上互连网络等计算机架构概念的人才。应聘者还需要在 C++(和 C)等低级面向对象编程语言方面有丰富的经验。Meta的一些与ASIC架构相关的招聘信息最早是在2023年12月发布的,但两周前又重新发布了。该公司此前曾表示,希望开发自己的"推理加速器",并将于 2024 年上线。据 NVIDIA 首席执行官黄仁勋(Jensen Huang)称,GPU 在改善 Meta 的"推荐引擎"和公司整体收入方面发挥了关键作用。但 NVIDIA 也表示,在不久的将来,它很可能无法为任何从事人工智能业务的人提供足够的 GPU 加速器。Meta 似乎也在研究人工通用智能 (AGI)这一难以捉摸的概念,这对于最新的 GPU 技术来说是一项极其艰巨的任务,但对于专用的 ASIC 芯片设计来说,却能从中获益匪浅。 ... PC版: 手机版:

封面图片

Linux 6.8 网络优化可将大量并发连接下的 TCP 性能提高约 40%

Linux 6.8 网络优化可将大量并发连接下的 TCP 性能提高约 40% 据 Phoronix 报道,Linux 6.8 内核对核心网络代码进行了一些关键改进,在遇到大量并发网络连接时,可将 TCP 性能可提高约40%。首先,对核心网络结构进行了分析和重组。这项工作的重点是优化缓存行消耗并添加保护措施以确保未来的更改不会倒退。反过来,这种核心网络结构的优化使大量并发连接的 TCP 性能提高了40%或更多。 目前,网络堆栈中的大量变量结构是按时间顺序、逻辑顺序组织的,有时还按缓存行访问进行组织。新的补丁系列尝试重新组织核心网络堆栈变量,以最大限度地减少数据传输阶段的缓存行消耗。具体来说,来自谷歌的开发人员研究了 TCP/IP 堆栈和 TCP 中的快速路径定义。

封面图片

Rocky Linux 将支持上游稳定内核

Rocky Linux 将支持上游稳定内核 CIQ 本周宣布,他们将在 Rocky Linux 中支持上游稳定内核。他们在一份新闻稿中写道:CIQ 的新产品是为满足最先进客户对超高性能、兼容性和安全性的需求而开发的,现在所有人都可以使用。新产品的开发源于一个存储用例,在该用例中,利用 AMD EPYC 处理器的大 PCIe 基底面至关重要。从那时起,随着企业意识到上游内核的优势,更多的用例也随之出现。遗憾的是,关于他们在 Rocky Linux 上的上游内核支持计划,目前还没有太多公开信息。此外,Rocky Linux 上的上游内核似乎可能只面向其商业客户,而不是免费提供所有资产,只提供商业支持。无论如何,看到Rocky Linux支持上游内核的选择,对于那些想享受最新的上游创新、性能改进和新硬件支持的人来说是件好事。毕竟性能和速度、更广泛的硬件兼容性和安全性是人们对 Rocky Linux 上游内核支持感兴趣的原因。 ... PC版: 手机版:

封面图片

60秒完成Linux系统的性能分析 ||

60秒完成Linux系统的性能分析 || 原文出自Netflix技术团队的博客。 在本文中,Netflix性能工程团队将使用您应该使用的标准Linux工具在命令行中向你展示一个性能诊断过程的前60秒。在60秒内,可以通过运行图中十个命令来了解有关系统资源使用和运行进程的信息。 最应该关注的是一些很容易理解的错误、饱和度指标和资源利用率等指标。饱和度是衡量资源负载超出其处理能力的指标,它可以通过观察请求队列的长度或等待时间反映出来。

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人