欢迎访问深圳市中小企业公共服务平台电子信息窗口
从DeepSeek创新看RISC-V“新贵”崛起
2025-03-03 来源:国际电子商情
0

关键词: RISC-V AI推理 DeepSeek 架构优势 标杆产品

RISC-V架构所具备的灵活性优势若能得到充分发挥,极有希望成为AI推理算力的理想搭档。未来,“RISC-V+AI将有望成为新组合,如同x86+Windows、Arm+安卓的经典组合”。

作为“生而开源”的芯片指令集架构,RISC-V在过去15年里发展势头强劲,从嵌入式系统加速挺进高性能等复杂场景,并为AI算力提供新选择。在RISC-V国际基金会2024年批准的25项标准中,超过一半与高性能或AI相关。RISC-V国际基金会董事会主席Lu Dai表示,RISC-V指令集最激动人心的进展之一是Matrix扩展,将推动RISC-V成为AI领域令人敬畏的力量。

根据达摩院玄铁团队分享的数据,2024年RISC-V国际基金会会员数超过4600,覆盖70+国家和地区。产业应用正在向高性能和并行计算加速发展,高性能和AI占比56%。预计到2031年,RISC-V在计算机领域占比将达到33%,消费领域将达到39%,自动驾驶领域达到31%,数据中心达到28%,工业达到27%,网络达到26%。同时,RISC-V高性能和AI基础软件生态日趋完善,国内外主流操作系统支持RISC-V架构,主流AI框架和模型支持RISC-V架构。

undefined

“RISC-V从发布至今只有短短的15年,它在全球芯片产业链中的地位正不断提升。”中国工程院院士倪光南指出,RISC-V的发展需要持续研发投入、高水平IP设计和全球化生态共建。而要真正进入数据中心和高性能计算市场,RISC-V必须要在SPECint 2006基准测试中跑出超过15分的高性能标准。

DeepSeek带来的变革与契机

随着DeepSeek等大模型的兴起,AI领域正经历着前所未有的变革,这也为RISC-V架构带来了新的发展契机。在北京开源芯片研究院首席科学家包云岗看来,AI推理的算力需求正呈现出两个显著特征:

  • 与CPU紧密协作。AI推理将会成为未来各种业务中不可或缺的环节,但业务主程序仍运行在CPU上——通过API调用将AI推理请求卸载到AI加速器,得到推理结果后再由CPU返回给用户

  • 呈现多样化需求。不同场景产生不同的算力需求,相应的资源约束也不同。比如云端推理算力要考虑满血版大模型的高效部署,端侧应用场景则往往会部署不同容量的裁剪版。

基于此,包云岗认为“RISC-V+AI迎来发展新契机”。也就是说,AI加速器在设计时需要充分考量与CPU的协同工作,并且要依据不同的需求实现高效定制。RISC-V架构所具备的灵活性优势若能得到充分发挥,极有希望成为AI推理算力的理想搭档。

他大胆预测,“RISC-V+AI将成为未来新组合,就如同x86+Windows、ARM+安卓的经典组合那样”。市场分析机构Omdia的预测也从侧面印证了这一趋势,预计到2030 年,基于RISC-V的AI处理器出货量将超过5亿颗。

“RISC-V在发展过程中,不应一味地将目光聚焦于对Arm的替代,而是要充分发挥自身灵活、可定制的独特优势,以此形成强大的产业竞争力。”包云岗强调说。

阿里达摩院首席科学家、知合计算CEO孟建熠也表达了相同的看法。他认为DeepSeek的出现打破了算力、内存、互联原有的平衡,通过一系列创新技术,新算力架构也有机会与传统经典架构站在同一起跑线,让开源大模型单机部署成为可能,有力推动实际应用的落地。

但DeepSeek的诞生,也引发了业界三个主要观点的争论:

  • 开源还是闭源架构:DeepSeek证明了开源模式在当下也能取得显著成果,为行业发展提供了新的思路和方向。

  • 用DENSE模型还是用MoE(混合专家模型)模型:DENSE模型是全能型选手,而MOE模型在专属领域表现出色,两种模型都有各自的优势和发展前景。

  • 内存容量成为AI大模型在算力以外的另一个指标:这促使行业更加关注底层硬件能力的适配,注重算力资源的精细化匹配,改变了过去“大炮打蚊子”式的资源浪费现象,强调从软硬件深度融合的视角重构系统设计,通过算法与硬件的联合优化提升整体效率,形成更高效的AI计算范式。

以RISC-V为基础构建处理芯片

按照孟建熠的说法,DeepSeek、Llama、Grok等开源大模型的涌现,并非只是RISC-V的机会,而是包括GPGPU、x86、DSA、ASIC等所有架构的机遇。但RISC-V 架构凭借其独特优势,在实现AI原生方面具有显著潜力,“RISC-V+AI”很可能成为现阶段架构创新的理想答案。

开放性和可扩展性显然是RISC-V在AI领域具备的首要优势。与x86和Arm等架构相比,RISC-V的ISA指令集架构完全开放,无需支付任何授权费用,任何参与者都能自由使用。其国际合作开发模式保障了全球范围内的兼容性,不同地区基于RISC-V 的芯片设计均可实现无缝对接。而且,RISC-V允许在芯片设计过程中添加定制指令以满足特定需求,这使得RISC-V芯片既能与旧有软件兼容,又能支持新功能的拓展。

其次,开源社区的开放协作,让各类大模型在基础架构设计上相互借鉴,形成技术方案趋同的行业现象,这不仅降低了重复研发成本,还推动了针对硬件的针对性优化。第三,DeepSeek将大模型蒸馏,使得更多模型能够走向端侧,而端侧丰富的应用场景将形成正向促进,让高性能AI应用能够在边缘设备上顺利运行。

在AI领域,RISC-V的包容性很强,可以支持CPU/DSA的设计,也能用于GPU、多核产品或者近内存计算的开发。随着开源RISC-V 架构的迅猛发展,重新自研架构已意义不大,以RISC-V为基础构建处理芯片成为未来主流趋势。孟建熠指出,当下发展RISC-V意义重大,最终行业必然走向生态统一。

undefined

阿里巴巴达摩院资深技术专家李春强表示,DeepSeek通过MOE等技术,大幅降低了同等效果下对算力的需求,这给后续芯片在计算能力、存储容量/带宽、芯片互联等方面的设计带来了新的平衡点。

尽管前景广阔,但RISC-V在AI领域的发展并非坦途,仍面临着诸多挑战。

包云岗坦言,RISC-V当前在开发的软硬件工具箱方面还不够丰富,与成熟的x86和Arm架构相比,存在着较大的差距。例如,在工具链、编译器、调试工具以及库等方面,RISC-V的生态系统尚不完善,这在一定程度上限制了开发者的开发效率和应用的拓展。同时,为了增强行业对RISC-V的信心,打造具有代表性的RISC-V标杆产品案例成为当务之急,这也是RISC-V生态能够持续成长和壮大的关键所在。

打造标杆产品是RISC-V发展的关键

虽然RISC-V本身与AI契合度高,但如何让其在市场中广泛应用是业界关注的重点。实际上,RISC-V在一些领域的生态已取得一定成果,从低功耗IoT场景到服务器场景,都有相关产品和生态出现,也诞生了一些标杆产品。阿里云无影事业部总裁张献涛预测,RISC-V架构从低功耗IoT终端大规模应用到数据中心,大概在5至8年内就能实现。

不过,这只是RISC-V发展的第一步。未来,它需要从“小标杆产品”迈向“大标杆产品”,这才是奠定RISC-V未来生态发展的关键一步。

undefined

以玄铁的探索历程为例,2019年7月,玄铁发布业界最高性能RISC-V处理器C910,是全球首个运行频率超过2GHz、SPECINT2K6达到7分/GHz的RISC-V处理器。2021年10月,玄铁C910成功兼容安卓系统,可运行Chrome浏览器等应用,这是芯片行业首次实现RISC-V架构对安卓的支持,意味着RISC-V架构有望打破场景壁垒,成为高性能芯片设计的新选择。

国际RISC-V企业也在积极行动。例如Tenstorrent 采用独特的硬件和软件紧密结合的方法,其硬件专门用于AI任务,而软件并不复杂,整个软件堆栈只有大约50000 行代码。VENTANA公司最新的CPU产品VEYRON V2,性能也超过了Arm Neoverse V2.

“RISC-V要真正在产业中脱颖而出,需实现更高的性价比。例如,如何用二十分之一的成本达到主流AI 芯片的效果,是RISC-V厂商需要思考的问题。”孟建熠进一步强调说,考虑到碎片化是当前RISC-V生态的现状,因此标准化建设将是RISC-V下一阶段发展的重要工作之一。

undefined

目前,国际厂商在指令架构方面的贡献高于国内厂商,国内力量的参与度有待提高,且需要将国内多个进行指令集制定工作的组织联合起来,统一到一个平台开展工作。而在技术路线规划上,应以AI为目标先进行国内标准制定的尝试,CPU、GPGPU、TPU在扩展上要形成一定梯度,避免指令集出现过多套不同标准。




Baidu
map