首页 > 3D标签Hopper 相关文章
DeepSeek开启“开源周”发布Flash MLA代码库,优化Hopper GPU加速

DeepSeek开启“开源周”发布Flash MLA代码库,优化Hopper GPU加速

DeepSeek启动开源周,发布Flash MLA代码库助力GPU优化2025年2月24日,北京——DeepSeek今日宣布启动其“开源周”计划,正式发布首个开源代码库——Flash MLA。这是一个专为Hopper GPU优化的高效MLA(多级解码)解码内核,经过针对可变长度序列的优化,已成功投入生产,标志着DeepSeek在开源技术领域迈出了重要一步。Flash MLA代码库:专为Hopper...

深度优化引领AI未来:DeepSeek开源DeepGEMM显著提升矩阵运算性能

深度优化引领AI未来:DeepSeek开源DeepGEMM显著提升矩阵运算性能

在AI技术的不断进步和GPU计算能力提升的背景下,DeepSeek团队近日发布了名为DeepGEMM的开源库,震撼了业界。仅用300行代码,DeepGEMM在Hopper GPU上突破了1350 TFLOPS的性能瓶颈,比传统优化技术更高效、更简洁,成为新一代矩阵乘法计算的理想工具。DeepGEMM是DeepSeek开源周的第三个项目,它专注于FP8矩阵乘法(GEMM)的加速,支持V3/R1训练...