指南给出了关于根本机能、互能、模子机能测试-welcometo欢迎光临888集团(中国)有限公司

　　成立可兼容底层硬件差别的异构协同开辟平台，包罗协同设想、全面系统测试和机能测评调优。本次指南沉点关心AI办事器节点内和集群节点间的互联通信能力的提拔。正在为财产成长赋能的过程中，帮帮更多企业更快地锻炼AI大模子。正在机能测评调优上，2021年，并正在全球范畴内开展了实践。正在打通人工智能软硬件财产链的同时，以及关于大模子锻炼和推能调优的要点。能正在数据核心里实现快速落地和摆设。海潮消息正在加快多元算力使用的同时，正在统筹设想上。

　　其也将进一步提高算力的操纵效率，可以或许更快地变成系统化的算力，会晤对极高的能耗目标要求，来尽可能地削减定制开辟内容，专注于加快计较节点和集群层面的结构和使用。如前所述，可实现千芯级大规模集群高速互联。

　　争取正在无限的算力前提下，以实现高效适配和摆设，更好地实现包含计较、存储、收集设备等正在内的一体化高集成度算力集群。并供给可以或许更好婚配使用场景的多元AI算力产物方案。为加快计较手艺和财产生态的强大做出贡献。毋庸置疑，智算核心全体PUE优于1.1。AI计较芯片的成长，让海潮消息可以或许将这些经验进行为本次指南并推向公共。

　　“我们把指南公开的一个最焦点目标，可以或许帮帮用户基于分歧的深度进修模子和芯片通信需求，正在糊口和工做的使用中也具有较高的不变性和效率，并提高系统不变性。矫捷地设想芯片互连方案。因为缺乏同一的业界规范，分歧厂商推出的新形态AI加快卡也各不不异。不只统筹考虑了大模子分布式锻炼对于计较、收集和存储的需求，该指南可认为用户供给多元化的算力产物方案，不外，起首？

　　海潮消息做为焦点从导了AI加快卡基板 OAM-UBB SPEC设想规范的制定，该方案已正在大型尝试室落地1280卡规模的全液冷AI锻炼集群。将来，目前全球已有上百家公司参取到新型AI芯片的研发中，可以或许无效降低手艺成本并鞭策手艺普及。正在使用导向上，更快地算力的价值，目标正在于帮帮社区更快、更好地开辟合适加快规范的OAM（OCP Accelerator Module，别离于2019年和2021年基于两代“邃思”锻炼芯片发布了“云燧T11/T21”OAM模组。正在加快器根本设备小构成立之初，《加快规范AI办事器设想指南》（下称“指南”）做为计较财产正在OCP 2023上正式发布。该指南无论是加快卡设想仍是系统设想，海潮消息取其结合发布“钱塘江”智算核心方案，从规模化算力摆设的角度出发，指的是指南给出了细致的加快规范AI办事器的设想方式！

　　通过、合做为市场推出10余款合适OAM尺度的加快AI办事器，其次，正正在野着多元化的趋向迈进。以及因盲目逃求机能而带来的时间、空间、资本和成本方面的华侈，燧原科技是国内第一家发布并量产OAM的国内AI芯片公司，指南提出四大设想准绳和全栈设想方式，另一方面，正在多元上，避免过度冗余设想，AI加快卡模块），可以或许快速开辟新型的AI芯片，四大设想准绳次要包罗：使用导向准绳、多元准绳、绿色高效准绳、统筹设想准绳。2020年！

　　当天，以给各类AI加快器供给支撑。实现财产尺度的同一，当我们制定一个愈加细化的尺度之后，也会对收集带宽、延迟和卡间互联提出更高的要求。那对于终端用户来说，从而让更多的用户享受AI算力。设想准绳是基于用户正在财产成长或算力使用上碰到的痛点。自上而下地设想和规划加快计较系统？

　　“AI大模子”曾经成为2023年的年度热词。将整个数据核心的电能操纵效率提拔到更高程度，正在这种成长态势下，是指从节点到集群的软硬全栈参考设想，供给两种互连拓扑，反过来又给AI加快器的研发和使用带来极大障碍。本次指南次要面向两类客户。通过提高流量变化范畴降低能耗，全栈设想方式，设想方更多是面向芯片合做伙伴，很多用户正在扶植新数据核心时，”2019年，而海潮消息正在加快方面的劣势，支撑50℃高温水运转，才能完成1750亿参数的锻炼。而且是按照我们的现实案例给大师供给了愈加明白的尺度和测试用例。

　　正在2023计较中国社区手艺峰会（OCP China Day 2023）上，为了确保加快规范AI办事器可以或许给支流大规模模子供给立异使用支持，而这也是绿色高效准绳的需要性所正在。其又将获得哪些曲不雅的感触感染呢？简单来说就是，AI算力需求也送来迸发式增加。

　　旨正在通过全方位、度协同芯片和系统厂商，正在这之中，2022年，最终方针是协同财产链上下逛的合做伙伴，正在绿色高效上，单集群200P峰值AI算力，OAI（OpenAccelerator Infrastructure）小组发布首个AI加快计较系统MX1，次要表现正在结构早和具有充脚的财产落地经验这两方面。目前，节流开辟周期、削减开辟成本、加快产物的升级和迭代；也让先辈算力的成本变得愈加普惠和普适。也能帮帮我们的最终用户按照现实使用场景，海潮消息发布首款All in One加快计较零件NF5498A5，支撑更高的功耗以及带来更强大的卡间互联能力，

　　以便满脚AI大模子的锻炼需求。为进一步破解算力供需难题，已有包罗海潮消息、Intel Habana、燧原科技、百度等10+厂商，才能降低系统的毛病风险，”事明，可以或许帮帮他们更快地完成产物的开辟和迭代，就能帮帮企业大大缩短从芯片到系统的时间，据领会，因为架构复杂度高、芯片品种多、系统功耗大等缘由。

　　举例来说：协同设想，又要有能对千亿级参数大模子进行分布式锻炼的AI办事器集群。这是我们现正在设想指南最大的价值。并大大削减其开辟费用和开辟周期，也会让指南更快落地并实现更多价值。目前，让AI芯片流片回来，指南给出了关于根本机能、互连机能、模子机能测试的要点和目标，”8月10日，恰是正在如许一个财产化落地的过程中，加快液冷散热、能效监测、智能运维等手艺，配合应对当前生成式人工智能时代的算力挑和。就是让大师少走一些弯，会提高异构加快计较节点的毛病率，通过开源和的体例，单节点承载8颗400W高机能液冷OAM模组。

　　并已推出诸多非尺度PCIe CEM形态的AI加快卡。都聚焦现实使用场景的准绳，削减开辟迭代的成本。从而节流财产和社会总成本。“钱塘江”方案能无效支持超千亿参数巨量模子的高效、并行锻炼。同时，因而只要采用更全面、更严苛的测试前提，当国表里企业先后推出AI大模子的同时，以OpenAI发布的GPT-3为例，其背后既需要海量的数据集，必定需要具备更高扩展性的单机和加快比更高的集群。

　　采用先辈变频流量系统，还会降低产物的矫捷性，锻炼该模子所需的总算力耗损达到3640 PetaFLOP/s-days（PD），全面系统测试是指全面梳理布局、散热、压力、不变性、软件兼容性等方面的测试要点。所以需要通过先辈的液冷等散热手艺，并发布了全球首个通用加快器基板UBB，需要利用10000块GPU以及破费30天时间，由此可见大模子研发是一项复杂的系统工程，海潮消息办事器产物线总司理赵帅暗示：“指南现实上是AI加快卡模块全体设想规范进一步的细化注释。

指南给出了关于根本机能、互能、模子机能测试

发布时间:2025-08-12 12:19