回复@江畔清风: 目前全球主要有四大并行计算框架,CUDA(NV),OPENCL(开源),Rocm( AMD公司 ),O...
左庶子()发布于2024-05-05 13:10来自雪球 · 上海关注来源:雪球App,作者: 左庶子,(https://xueqiu.com/1143179207/288797046)
回复@江畔清风: 目前全球主要有四大并行计算框架,CUDA(NV),OPENCL(开源),Rocm(AMD公司),OneAPI(Intel)。DeepLink的资料确实不多,背后有哪些大佬入局,这对生态的成功非常重要//@江畔清风:回复@左庶子:實現這一點的關鍵,是我們參與聯合開發的DeepLink開放計算體系。它可以說是目前國內並行計算平臺裡的佼佼者,是連接國產硬件和主流深度學習算法框架的橋樑和紐帶。DeepLink有300參個標準化算子接口:基本上CUDA支持的AI大模型計算需求,DeepLink也完全能夠支持,覆蓋率在99.5%以上。有了DeepLink,各類國產芯片就可以輕鬆適配主流的大模型訓練框架和算法庫,比如PyTorch、DeepSpeed等常見的開源訓練框架,還有商湯推出的OpenMMMLab、OpenDILab、OpenGVLab等開源算法庫,充分發揮國產芯片的性能。这个将会超过预期!查看对话风险提示:用户发表的所有文章仅代表个人观点,与雪球的立场无关。投资决策需建立在独立思考之上。
2025-08-21 04:43:24