
太平洋科技快讯】近日,深圳河套学院AI检修平台格式团队齐集哈尔滨工业大学(深圳)、深圳市大数据商榷院、华为及深智城AI算力平台,基于昇腾910C国产AI算力集群,告捷完成1.6万亿参数DeepSeek-V4-Pro大模子的全参数后检修。这一实践,也为人人第三方机构使用国产算力开展同级别大模子检修积聚了实践申饬,考据了国产AI芯片具备撑执天下级超大参数模子检修的能力。

万亿参数大模子是刻下AI边界前沿场地,在逻辑推理、数理运算、代码生成、长文本解析等场景能力凸起。这类模子的全参数检修,对硬件算力、集群清楚性、算法适配齐有着极高圭臬。过往人人万亿级大模子检修大多依赖国外算力居品,国产算力此前多应用于模子推理、小幅微调,难以胜任全参数深度检修,亦然行业遥远存在的本领难点。
本次检修对象DeepSeek-V4-Pro选拔夹杂人人(MoE)架构,该结构闲居调用仅激活部分模块,运转成果较高,但在后检修阶段,模块间数据交互量会数倍提高,类似动态老成力机制,世界杯官方入口对算力同样、显存不停提议严苛进修。要是说模子推理仅仅简便的单向数据输出,那么全参数后检修则包含多层响应与迭代逻辑,合座狡计、通讯压力大幅增多。
尊龙凯时中国官方入口针对上述难点,研发团队在千卡级算力集群上达成多项本领冲破。领先是分袂式显存拆分决策,将海量模子参数合理分拨至各狡计卡,完成精采化算力同样;其次优化负载平衡政策,处分MoE架构下模块任务分拨不均、跨卡通讯拥挤问题;终末搭建全历程可视化监控体系,保险扫数检修历程清楚运转。本次检修累计完成1500多步迭代,全程未出现中断、故障。
数据浮现世界杯官方入口,该格式模子算力运用率(MFU)冲破30%,中枢检修算子成果提高14%,各项盘算均达到工业级应用圭臬。这次攻关走漏,国产算力不再局限于模子推理要领,统共可连结顶级超大参数大模子的全参数检修任务,联系本理会线具备落地价值。