邮箱:chinacnee@163.com | 电话:400-089-1891
刊名 科技新时代
作者 陈 锋1 王春生2 徐文兵2 张翔宇3 谭 伟3 单位 1.苏州超级计算中心有限公司 江苏 苏州 215123; 2.江苏省未来网络创新研究院 江苏 南京 211111; 3.上海燧原科技股份有限公司 上海 201203 年,卷(期) 2025年,第1期
主办单位 北京卓众出版有限公司 国内刊号 CN11-3750/N 国际刊号 ISSN1006-981X
入库时间 2025-02-22
基于CENI确定性网络的分布式AI算力集群解决方案研究
作者:陈 锋1 王春生2 徐文兵2 张翔宇3 谭 伟3 时间:2025-02-22 阅读:57
收录报告下载 截图下载
摘要:随着人工智能大模型的广泛应用,其对算力的需求急剧增加,对现有计算资源构成巨大挑战。本文提出了一种基于广域AI算力集群的分布式解决方案,旨在通过整合分散的计算资源,提升算力利用效率,缓解大模型对算力需求的巨大压力。该解决方案以国产AI芯片为核心,结合国家重大科技基础设施-未来网络试验设施(CENI)确定性网络,构建一个高效、可扩展的分布式计算环境,通过精细设计的架构和关键技术,实现了数据的快速交换、资源的动态调度以及高可靠性的容错与恢复机制。试验结果表明,该解决方案显著提高了模型训练和推理速度,同时保持了模型的准确稳定,有效优化了资源利用率。此外,该方案还有助于推动国产AI芯片的技术进步,增强我国在人工智能领域的自主可控能力。通过深入探讨解决方案的可行性、存在的问题及改进措施,本文为基于广域AI算力集群的分布式计算提供了有价值的参考和借鉴。