开云(中国)Kaiyun·体育官方网站-登录入口

新闻动态

开云下载网址长入运算架构)能大幅缩小研发大模子的难度-开云(中国)Kaiyun·体育官方网站-登录入口

发布日期:2026-04-07 04:55    点击次数:160

开云下载网址长入运算架构)能大幅缩小研发大模子的难度-开云(中国)Kaiyun·体育官方网站-登录入口

快科技2月5日音信,DeepSeek巨匠爆火,再一次引发外界对GPU算力措施话题的慈祥。

据报谈,DeepSeek建造的大谈话模子绕过了英伟达的CUDA框架,正为翌日兼容国产GPU芯片作念准备。

无人不晓,英伟达的CUDA(Compute Unified Device Architecture,长入运算架构)能大幅缩小研发大模子的难度,获巨匠建造商使用,一举将英伟达推上AI芯片范围的把握地位。

但最新发现涌现,DeepSeek使用英伟达的H800芯片考试时,使用英伟达底层硬件请示PTX(Parallel Thread Execution)谈话,而非高等编程谈话CUDA。

这么意味着DeepSeek绕过了CUDA,使用更底层的编程谈话作念优化。

关于关键建造东谈主员来说,CUDA是一种愈加友好的高等谈话,建造者只需要专注于关键和算法最关联的运转逻辑,而不太需要酌量具体的关键是如安在GPU等硬件上具体何真正施计较的,从而大概缩小建造难度。

而PTX在接近汇编谈话的层级运转,允许进行细粒度的优化,如寄存器分拨和Thread / Warp级别的调遣。这种编程特殊复杂且难以难得,是以行业通用的作念法是使用CUDA这么的高等编程谈话。

换句话说,DeepSeek把优化作念到了极致。

北京航空航天大学副教养黄雷示意,绕过CUDA不错径直凭证GPU的驱动函数作念一些新的建造,从而终了愈加细粒度的操作。

这也诠释DeepSeek领有一些擅长写PTX谈话的里面建造者。假如它之后使用国产GPU,其在硬件适配方面将会更轻车熟路,其唯一了解这些硬件驱动提供的一些基本函数接口,就不错仿照英伟达GPU硬件的编程接口去写关联的代码,从而让自家大模子愈加容易适配国产硬件。

“这突显了DeepSeek不凡的工程水平,并标明好意思国对华制裁加重的“GPU枯竭危境”引发了他们首要感和创造力。”韩国Mirae Asset Securities Research的又名分析师示意。

【本文扫尾】如需转载请务必注明出处:快科技背负剪辑:朝日开云下载网址著述本色举报

【本文扫尾】如需转载请务必注明出处:快科技

背负剪辑:朝日

著述本色举报

]article_adlist-->   声明:新浪网独家稿件,未经授权不容转载。 -->