IBM重磅推出全新Telum处理器,依托新一代IBM Z大型主机加速AI应用

syxg1b38e

时间 2024年9月2日 预览 45

转载:https://ai.zol.com.cn/896/8961308.html

2024-08-30 11:14:46·[??中关村在线 原创??]·作者:十一

近日,IBM在Hot Chips 2024大会上公布了即将推出的IBM Telum II处理器和IBM Spyre加速器的架构细节。这些新技术旨在大幅扩展下一代IBM Z大型主机系统的处理能力,通过新的AI集成方法,加速企业对传统AI模型和大语言AI模型的协同使用。

随着基于大语言模型的AI项目从概念验证阶段进入生产阶段,企业对高能效、高安全性和高度可扩展解决方案的需求日益迫切。摩根士丹利最近发布的一份研究报告预测,在未来几年,生成式AI的电力需求将以每年75%的速度激增,其2026年的能耗或将与西班牙2022年的全年能耗相当。许多IBM客户表示,支持适当规模的基础模型和针对AI工作负载的混合架构越来越重要。

此次IBM发布的主要创新技术包括:

IBM Telum II 处理器:这一全新芯片将搭载于下一代IBM Z系列主机,与第一代Telum芯片相比,其频率和内存容量均有提升,高速缓存提升40%;集成 AI 加速器内核和数据处理单元 (DPU) 的性能也得到改善。IBM Telum II处理器将支持大语言模型驱动的企业计算解决方案,满足金融等行业的复杂交易需求。

IO 加速单元:Telum II处理器芯片上的全新数据处理单元 (DPU) 旨在加速大型主机上用于联网和数据存储的复杂 IO 协议,可简化系统操作,提高关键组件性能。

IBM Spyre加速器:可提供额外的AI计算能力,与Telum II处理器相得益彰。Telum II和Spyre芯片共同构成了一个可扩展的架构,可支持AI集成建模方法,即将多个机器学习或深度学习的AI模型与基于编码器的大语言模型相结合。通过利用每个模型架构的优势,AI集成的方法可以生成比单个模型更准确、更稳健的结果。Spyre 加速器芯片在Hot Chips 2024大会期间进行了预览,并将作为Telum II处理器的附加选件提供。每个加速器芯片均与IBM 研究院合作开发,通过一个75瓦PCIe适配器连接。与其他PCIe卡一样,Spyre加速器可根据客户需求进行扩展。

IBM主机和LinuxONE产品管理副总裁Tina Tarquinio表示:“得益于IBM强大的多代并行的开发路线图,我们得以在保持技术领先的同时,满足企业不断升级的AI需求。Telum II 处理器和Spyre加速器旨在提供安全、节能、高性能的企业计算解决方案。这些多年研发的创新成果将被引入下一代IBM Z平台,帮助客户大规模利用大语言模型和生成式AI技术。”

Telum II处理器和IBM Spyre加速器将由IBM的长期合作伙伴三星晶圆代工(Samsung Foundry)生产,采用其高性能、高能效的5纳米工艺节点。二者将共同支持企业的先进AI用例,释放业务价值,从而创造新的竞争优势。利用AI集成的方法,客户可以更快、更准确地获得预测结果。适用的生成式AI用例包括:

保险理赔欺诈检测:通过AI集成方法将大语言模型与传统神经网络相结合,以提高性能和准确性,增强对保险理赔欺诈的检测。

反洗钱高级监测:对可疑金融活动进行高级检测,支持遵守监管要求并降低金融犯罪风险。

AI 助手:加速应用生命周期、知识和专业技能的传授、代码解释和转换等。

规格和性能指标:

Telum II处理器:配备八个运行频率达5.5GHz的高性能内核,每个内核配备36MB二级高速缓存,片上高速缓存容量增加40%(总容量达360MB)。每个处理器抽屉的虚拟L4高速缓存为2.88GB,相比上一代增加40%。集成的AI加速器可实现低延迟、高吞吐量的交易中AI推理,例如增强金融交易期间的欺诈检测,并且每块芯片的计算能力是上一代的四倍。

Telum II芯片中集成了最新的I/O加速单元DPU。在设计上,其I/O密度提高50%,可大幅提高数据处理能力,进一步提高IBM Z的整体效率和可扩展性,使其成为处理大规模AI工作负载和数据密集型应用的不二之选。

Spyre 加速器:这是一款专为复杂AI模型和生成式AI用例提供可扩展功能的企业级加速器。它有高达1TB的内存,可在普通IO抽屉的八块卡上串联工作,以支持大型主机的整体AI 工作负载,同时每块卡的功耗不超过 75W。每块芯片由32个计算内核组成,支持int4、int8、fp8和fp16数据类型,适用于低延迟和高吞吐量的AI应用。

产品时间表

作为IBM下一代IBM Z和IBM LinuxONE平台的中央处理器,Telum II处理器预计在2025年向IBM Z和LinuxONE客户提供。IBM Spyre加速器仍在技术预览阶段,预计也将于2025年推出。

【包邮】人工智能全书:一本书读懂AI基础知识、商业应用与技术发展

[经销商]?京东商城

[产品售价]?¥ 64.9元

本文属于原创文章,如若转载,请注明来源:IBM重磅推出全新Telum处理器,依托新一代IBM Z大型主机加速AI应用https://ai.zol.com.cn/896/8961308.html

Copyright2024AIX科技提供
拨打电话拨打电话
Copyright2024AIX科技提供