IBM力推云服务平台考虑使用自家AI芯片降低成本

IBM力推云服务平台考虑使用自家AI芯片降低成本十多年前，IBM的首个主要AI系统“Watson”未能取得市场关注度。而十多年后，IBM希望利用生成式AI技术的蓬勃发展，大力宣传新的“Watsonx”云服务。“Watsonx”平台主要面向企业，企业可以利用该平台来建立自己的模型，从而为客户服务或编写代码等。降成本旧的“Watson”系统面临的障碍之一是高成本，IBM希望这次能够解决这个问题。Khare表示，使用自家的芯片可以降低云服务成本，因为它们非常节能。IBM在10月份宣布了这种AI芯片。这是一种专用集成电路(ASIC)，旨在更快、更高效地训练和运行需要大规模并行计算的深度学习模型。Khare周二透露，这款AI芯片是由三星电子代工的，三星电子与IBM在半导体研究方面有合作关系，IBM正在考虑将其用于WatsonX。IBM尚未确定该芯片何时可供云客户使用，但Khare表示该公司已经有数千个原型芯片投入使用。AIU芯片的特色如今众多科技巨头，例如Alphabet旗下的Google和亚马逊等公司，都开始着手设计自己的AI芯片。不过，英伟达的芯片在训练具有大量数据的AI系统方面仍处于市场领先地位。Khare对此表示，IBM并没有试图设计一款能直接替代英伟达芯片的产品。IBM设计的AIU芯片是专为深度学习模型加速而设计的，并针对矩阵和矢量计算进行了优化。AIU能够以远超CPU的速度执行数据分析，并且也还能够解决高复杂的计算问题。这款芯片设计之时，IBM认为有些计算任务并不需要高精度，于是提出了一个新术语“近似计算”，降低了传统计算精度。就好比人类大脑，即便没有高分辨率，也能分辨出家人或者小猫小狗。在AIU芯片的设计中，近似计算发挥着重要作用，这种芯片虽计算精度低于CPU，但同时也让运算执行速度翻倍。所以，IBM指出AIU芯片旨在提高成本效益，即让一个已经训练有素的人工智能系统在现实世界中快速做出决策。...PC版：https://www.cnbeta.com.tw/articles/soft/1370451.htm手机版：https://m.cnbeta.com.tw/view/1370451.htm

在Telegram中查看

相关推荐

ChatGPT运行每天或花费70万美元微软开发自主芯片尝试降低成本

ChatGPT运行每天或花费70万美元微软开发自主芯片尝试降低成本帕特尔指出，ChatGPT需要庞大的算力，才能基于用户的输入信息做出反馈，包括撰写求职信、生成教学计划，以及帮助用户优化个人资料等。他表示：“大部分成本都来自于昂贵的服务器。”此外，帕特尔最初的估计基于OpenAI的GPT-3模型，而在采用最新的GPT-4模型之后，ChatGPT现在的运行成本可能更高。对此，OpenAI尚未对此做出回应。帕特尔和SemiAnalysis的另一位分析师阿夫扎尔·艾哈迈德（AfzalAhmad）表示，此前外界已经注意到，训练ChatGPT背后的大语言模型可能要花费上亿美元，但运营费用，或者说人工智能推理的成本，以任何合理的部署规模来看都远远超过了训练成本。他们指出：“事实上，按周来看，ChatGPT的推理成本超过了训练成本。”过去几年，使用OpenAI语言模型的公司也一直在承担高昂的价格。创业公司Latitude开发了一款基于用户输入信息生成故事情节的人工智能地下城游戏。该公司首席执行官尼克·沃尔顿（NickWalton）表示，运行该模型，以及相应的购买亚马逊AWS云服务器的费用2021年达到每月20万美元。因此，沃尔顿最终决定改用AI21Labs支持的语言软件提供商。这帮助他将公司的人工智能成本降低了一半，至每月10万美元。沃尔顿在接受采访时表示：“我们会开玩笑说，我们有人类员工和人工智能员工，在这两类员工身上花费的成本大致相同。我们每个月在人工智能上花掉数十万美元，而且我们也不是一家大型初创公司，所以这是一笔巨大的开支。”近期有报道称，为了降低生成式人工智能模型的运行成本，微软正在开发一款代号为“雅典娜”的人工智能芯片。该项目于2019年启动。在此几年前，微软与OpenAI达成了10亿美元的投资协议，要求OpenAI仅在微软的Azure云服务器上运行其模型。微软启动这一芯片项目的背后有两方面思考。知情人士透露，微软高管意识到，他们在自主芯片开发方面落后于谷歌和亚马逊。与此同时，微软正在寻找更便宜的方案去替代英伟达的GPU芯片。目前，微软大约有300多名员工正在开发这款芯片。消息人士称，该芯片最早可能在明年发布，供微软和OpenAI内部使用。微软拒绝对此消息置评。...PC版：https://www.cnbeta.com.tw/articles/soft/1355963.htm手机版：https://m.cnbeta.com.tw/view/1355963.htm

IBM模拟AI芯片登Nature：能效提升14倍语音识别速度提升7倍

IBM模拟AI芯片登Nature：能效提升14倍语音识别速度提升7倍一、利用PCM存储数据，模拟芯片解决AI技术高能耗问题AI相关技术在飞速发展的同时，也面临着能源消耗的问题。为了提升能源效率，IBM来自世界各地实验室的研究人员共同研发了这款模拟AI芯片。据称，在两个AI推理实验中，该芯片都像同类数字芯片一样可靠地执行任务，但其完成任务的速度更快，能耗更低。IBM称，其研究人员一直都在深耕模拟AI芯片领域。2021年，其团队就发布了一款名为Fusion的模拟芯片，利用PCM设备的存储能力和物理属性，更高效地实现人工神经网络。传统计算机基于冯·诺依曼结构——一种将程序指令存储器和数据存储器合并在一起的电脑设计概念结构，每次计算都将数据从DRAM（动态随机存取存储器）内存传输到CPU，导致工作速度受到实际限制，永远无法实现CPU的真正计算能力，这被称为“冯·诺依曼瓶颈”。▲当每次计算将数据从DRAM内存传输到CPU时，传统计算机就会出现瓶颈（图源：IBM官网）通过利用PCM设备的物理特性，模拟芯片可以克服冯·诺依曼瓶颈，在存储数据的同一位置执行计算。由于没有数据移动，它可以在很短的时间内执行任务，并且消耗的能源更少。▲模拟芯片通过在存储数据的地方执行计算来克服瓶颈（图源：IBM官网）例如，将64位数据从DRAM移动到CPU会消耗1-2nJ（纳焦）能量，而在PCM设备上执行只需消耗1-100fJ（飞焦），是前者的1万至200万分之一。当扩展到数十亿次操作时，所节省的能源是巨大的。此外，当设备不活动时，PCM不会消耗电力，即使断电数据也将保留10年。二、采用全新设计方式，14nm芯片可编码3500万个PCM虽然IBM早在两年前便以研发出了模拟芯片，并尝试将其用于提升AI计算性能，但Fusion芯片一次只能访问一个PCM设备，对速度和能效的提升并不显著。IBM本次发布的这款芯片采用了新的设计方式，利用34个大型PCM阵列，结合了数模转换输入、模拟外围电路、模数转换输出和大规模并行二维网格路由。每个14nm芯片上可编码3500万个PCM，在每权重对应2-PCMs的方案中，可容纳1700万个参数。将这些芯片组合在一起，便能够像数字芯片一样有效地处理真实AI用例的实验。▲IBM模拟AI芯片的显微照片（图源：论文插图）上图中，图a显示了芯片的显微照片，突出显示了34个PCM阵列模块的2D网格，每个模块都有自己的512×2,048PCM交叉阵列。PCM器件集成在14nm前端电路上方的后端布线中（图b），可通过电脉冲调整窄底电极上晶体相（高导电性）和非晶相（高电阻性）材料的相对体积来编码模拟电导状态。对PCM器件进行编程时采用并行编程方案（图c），这样同一行中的所有512个权值都会同时更新。该研发团队采用的方法是优化主导深度学习计算的MAC（乘积累加运算）。通过读取电阻式NVM（非易失性存储器）设备阵列的行，然后沿列收集电流，团队证明可以在存储器内执行MAC，无需在芯片的存储器和计算区域之间或跨芯片移动权重。三、精确度不减，语音识别速度提升7倍、大模型运行能效提升14倍为了验证芯片的有效性，该团队设计了两个实验对其进行测试。他们从MLPerf中选择了两个神经网络模型，分别是语音唤醒和语音转文本模型。MLPerf由斯坦福、哈佛等顶尖学术机构发起成立的，权威性最大、影响力最广的国际AI性能基准测试。第一个实验围绕关键词语音检测展开。该团队提出了一种卷积神经网络架构，并在包含12个关键字的谷歌语音命令数据集上进行训练。团队采用了架构更简单的FC（全连接）网络结构，最终达到了86.14%的识别精度，且提交速度比MLPerf目前最佳情况快7倍。该模型使用硬件感知训练在GPU上进行训练，然后部署在团队的模拟AI芯片上。▲端到端语音唤醒任务相关图表（图源：论文插图）第二个实验围绕语音转文本展开，规模更大。团队使用5个模拟AI芯片组合在一起，运行RNN-T（循环神经网络转换器）模型，以逐个字母地转录语音内容。该系统包含5个芯片上1.4亿个PCM设备的4500万个权重，能够采集人们说话的音频并以非常接近数字硬件设置的精度进行转录。该实验最终达到9.258%的单词错误率，能量效率达6.704TOPS/W（万亿次操作每秒/瓦），比MLPerf目前最佳能效提高了14倍。▲模拟AI芯片在RNN-T模型上表现出的性能相关图表（图源：论文插图）与第一个实验不同，这个实验并不完全是端到端的，这意味着它确实需要一些片外数字计算。IBM称，这里涉及的额外计算很少，如果在芯片上实现，最终的能效仍然高于当今市场上的产品。结语：模拟AI芯片能否成为下一个趋势继2021年推出第一款模拟芯片Fusion后，IBM于近日发布了专攻AI的模拟芯片，速度、能效均比传统数字芯片大幅提升，准确率也保持高水准。传统芯片受制于“冯·诺依曼瓶颈”，而模拟芯片可以打破这一桎梏，为AI技术带来新的生命力。未来，模拟芯片市场能否得到进一步发展，我们会持续关注。来源：Nature、IBM官网...PC版：https://www.cnbeta.com.tw/articles/soft/1379447.htm手机版：https://m.cnbeta.com.tw/view/1379447.htm

Jim Keller 试图设计更高效芯片，降低 AI 应用成本挑战英伟达

JimKeller试图设计更高效芯片，降低AI应用成本挑战英伟达Tenstorrent的Galaxy系统比NVIDIADGX效率高三倍，价格便宜33%。Keller指出，能做到这点是因为Tenstorrent没使用HBM内存，「即使是使用HBM的人，也在为成本以及构建HBM所需的设计时间而挣扎，因此决定不使用该技术」。HBM是AI芯片能耗巨大、价格高昂的罪魁祸首之一。

IBM的新型模拟人工智能芯片比GPU更高效

IBM的新型模拟人工智能芯片比GPU更高效新的模拟人工智能芯片仍在开发中，它能够在同一位置同时计算和存储内存。这种设计模拟了人脑的运作，从而提高了能效。该技术不同于当前的解决方案，当前的解决方案需要在内存和处理单元之间不断移动数据，从而降低了计算能力，增加了功耗。在该公司的内部测试中，在评估模拟内存计算的计算精度时，新芯片在CIFAR-10图像数据集上显示出92.81%的准确率。IBM声称，这一精确度水平可与采用类似技术的任何现有芯片相媲美。更令人印象深刻的是它在测试过程中的能效，每次输入仅消耗1.51微焦耳的能量。上周发表在《自然-电子学》（NatureElectronics）上的这篇研究论文还提供了有关该芯片构造的更多信息。该芯片采用14纳米互补金属氧化物半导体（CMOS）技术制造，拥有64个模拟内存计算内核（或瓦片）。每个内核都集成了一个256x256的突触单元交叉阵列，能够执行与一层深度神经网络（DNN）模型相对应的计算。此外，该芯片还配备了一个全局数字处理单元，能够执行对某些类型的神经网络至关重要的更复杂运算。IBM的新芯片是一项引人关注的进步，尤其是考虑到近来人工智能处理系统的功耗呈指数级增长。有报告显示，人工智能推理机架的耗电量通常是普通服务器机架的10倍，这导致了高昂的人工智能处理成本和环境问题。在这种情况下，任何能提高处理效率的改进都会受到业界的热烈欢迎。作为额外的好处，专用的高能效AI芯片有可能减少对GPU的需求，从而降低游戏玩家的价格。不过，值得注意的是，这目前只是推测，因为IBM芯片仍处于开发阶段。其过渡到大规模生产的时间表仍不确定。在此之前，GPU仍将是人工智能处理的主要选择，因此在不久的将来，GPU的价格不太可能变得更低。...PC版：https://www.cnbeta.com.tw/articles/soft/1378527.htm手机版：https://m.cnbeta.com.tw/view/1378527.htm

AI用作辅助工具助力缩短新药研发流程降低成本

AI用作辅助工具助力缩短新药研发流程降低成本一项新研究显示，科研人员能利用人工智能工作辅助开发原创新药，成功实现一款候选药物早期研发降本增效，并在一期临床试验中取得理想结果。新华社星期二（3月12日）报道，这是一款治疗特发性肺纤维化（idiopathicpulmonaryfibrosis，IPF）的小分子候选药物，由人工智能（AI）驱动的生物医药公司英矽智能领衔的团队，利用AI药物发现平台Pharma.AI筛选靶点，并设计药物。IPF是一种原因不明，以弥漫性肺泡炎和肺泡结构紊乱最终导致肺间质纤维化为特征的疾病。科研人员与平台反复互动，给予平台正向或负向的反馈，不断缩小潜在靶点和化合物分子结构筛选范围，优化靶点和化合物选择。据介绍，英矽智能基于该公司自2014年成立以来积累的大量数据来建立了Pharma.AI平台。研究论文作者之一、英矽智能研究员赵衡说，针对科研人员关注的病症，Pharma.AI可以分析多种数据和生物通路，以筛选出相应的潜在靶点，再根据选定靶点列举分子结构。该平台还可以“反向”筛选，针对已知分子结构列举相应的作用靶点和适用的病症，通过“老药新用”等策略缩短新药研发流程。论文第一作者、英矽智能联合首席执行官兼首席科学官任峰介绍说，在这款候选药物进入临床前，研究团队历时18个月共生成78个候选化合物。相比传统制药方法，由人工智能驱动的药物研发效率显著提升，而成本大幅降低。目前，这款候选药物正在中美两国同步展开两项随机双盲对照2a期临床试验，有望成为首款作用靶点与化合物分子均由人工智能平台发现且研发成功的创新药物。英矽智能创始人兼首席执行官亚历克斯·扎沃龙科夫说，医药研发是需要全球共同应对的挑战，这项研究让人们可以更深入了解以科学数据为支撑、用人工智能发现和设计新药的成效。这项研究已刊发在英国《自然·生物技术》杂志，科研人员来自中国、美国、加拿大、阿联酋等国。2024年3月12日9:03PM

新款PS5是为了降低成本而非撼动市场地位

新款PS5是为了降低成本而非撼动市场地位索尼的应对方式则是在除北美以外的全球范围内提高了PS5的销售价格，并发布了多个硬件版本，以减轻重量，提高系统效率。据了解，索尼每年通过销售PlayStation系统硬件能赚取数十亿美元。此外，与游戏机硬件配套的配件市场也利润丰厚，其外设/配件业务利润很高。媒体认为，新款PS5机型是索尼战略的最新例证。与其他游戏机升级改版一样，这些新的PS5超薄机型的推出旨在通过降低制造、生产和运输成本来提高盈利能力。索尼在PS5的改版中特别注重减少重量和尺寸（宽度、高度和厚度）。游戏机越轻，索尼通过海外货运运送游戏机的成本就越低。PlayStation游戏机的各种组件都是在日本以外生产的，然后运到索尼位于日本木更津的大型组装线等各种设施。组装完成后，这些游戏机被运往北美、欧洲和中国等世界各地。除了商业上的考虑之外，索尼还希望通过新PS5系列的外形设计来迎合当前的潮流。据悉，新款PS5Slim重量分别减少了18%-24%，体积则减小了30%，内部存储空间从825GB增至1TB。价格方面，超高清蓝光光驱版售价499.99美元，数字版449.99美元，可拆卸光驱售价79.99美元。...PC版：https://www.cnbeta.com.tw/articles/soft/1389507.htm手机版：https://m.cnbeta.com.tw/view/1389507.htm

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人

相关推荐

ChatGPT运行每天或花费70万美元 微软开发自主芯片尝试降低成本

IBM模拟AI芯片登Nature：能效提升14倍 语音识别速度提升7倍