第405章 天权6号热功耗攻坚(2 / 2)

问题彻底摊开了。三个泄漏源,两个在设计层面,一个在方法论层面。留给团队的时间并不宽裕——天权6号的流片窗口定在十个月后,而解决热功耗问题需要重新设计GPU核心的部分微架构,从RTL修改到功能验证再到物理设计,每一步都卡在临界线上。

章宸没有急于定方案,而是问了一个问题:「自研GPU架构和之前用的第三方GPU IP相比,设计复杂度增加了多少?」

林薇从抽屉里拿出一张架构对比图。天权5号使用的是经过深度定制的第三方GPU IP核,性能不错但架构黑盒,无法做底层的功耗优化。天权6号的自研GPU架构名为「羲和」,从指令集到微架构全部自研,张量计算阵列丶纹理处理单元丶缓存层次结构都经过了重新设计,算力密度比第三方IP高出百分之四十,但功耗控制也相应复杂了一倍以上。

「自研架构的方向没有错。」林薇的语气很坚定,「第三方GPU IP的黑盒限制我们只能做外围优化,相当于在别人打好的地基上盖房子。羲和架构让我们第一次拥有了GPU底层设计的完整自由度,这次热功耗问题暴露的恰恰是我们可以通过架构优化来解决的——时钟树可以重构,数据通路可以重布,互联协议可以重写。如果还在用第三方IP,遇到同样的功耗问题我们连改的权限都没有。」

这话让章宸想起陈醒在启动「补天」计划时说的那句「我们也能写EDA」。自研的代价是踩坑,但不自研的代价是把命脉交在别人手里。两害相权,未来科技选前者。

「三个泄漏源,分三条线同时攻坚。」章宸在白板上画了一个三叉戟结构,「第一条线,张量计算阵列的时钟树重构。目标是把动态功耗降回预算线以内,但不能牺牲算力密度——天权6号的AI推理性能是我们的核心卖点,不能因为解决功耗问题就把性能优势丢掉。」

张京京接话:「可以用多时钟域设计,把张量阵列按工作负载分成四个独立的时钟域。轻负载时只激活一个域,重负载时四个域并行,这样平均功耗和峰值功耗之间的波动幅度可以压缩百分之四十以上。代价是控制逻辑复杂一些,RTL代码量增加大约百分之十五。」

「做。」章宸在白板上写下一个「锺」字,「第二条线,数据通路静态漏电优化。四百七十倍的仿真偏差,说明我们的漏电模型本身就有问题。」