
快科技2月5日音信,DeepSeek巨匠爆火,再一次引发外界对GPU算力措施话题的慈祥。
据报谈,DeepSeek建造的大谈话模子绕过了英伟达的CUDA框架,正为翌日兼容国产GPU芯片作念准备。
无人不晓,英伟达的CUDA(Compute Unified Device Architecture,长入运算架构)能大幅缩小研发大模子的难度,获巨匠建造商使用,一举将英伟达推上AI芯片范围的把握地位。
但最新发现涌现,DeepSeek使用英伟达的H800芯片考试时,使用英伟达底层硬件请示PTX(Parallel Thread Execution)谈话,而非高等编程谈话CUDA。
这么意味着DeepSeek绕过了CUDA,使用更底层的编程谈话作念优化。
关于关键建造东谈主员来说,CUDA是一种愈加友好的高等谈话,建造者只需要专注于关键和算法最关联的运转逻辑,而不太需要酌量具体的关键是如安在GPU等硬件上具体何真正施计较的,从而大概缩小建造难度。
而PTX在接近汇编谈话的层级运转,允许进行细粒度的优化,如寄存器分拨和Thread / Warp级别的调遣。这种编程特殊复杂且难以难得,是以行业通用的作念法是使用CUDA这么的高等编程谈话。
换句话说,DeepSeek把优化作念到了极致。
北京航空航天大学副教养黄雷示意,绕过CUDA不错径直凭证GPU的驱动函数作念一些新的建造,从而终了愈加细粒度的操作。
这也诠释DeepSeek领有一些擅长写PTX谈话的里面建造者。假如它之后使用国产GPU,其在硬件适配方面将会更轻车熟路,其唯一了解这些硬件驱动提供的一些基本函数接口,就不错仿照英伟达GPU硬件的编程接口去写关联的代码,从而让自家大模子愈加容易适配国产硬件。
“这突显了DeepSeek不凡的工程水平,并标明好意思国对华制裁加重的“GPU枯竭危境”引发了他们首要感和创造力。”韩国Mirae Asset Securities Research的又名分析师示意。

【本文扫尾】如需转载请务必注明出处:快科技
背负剪辑:朝日
著述本色举报 ]article_adlist--> 声明:新浪网独家稿件,未经授权不容转载。 -->