• <xmp id="om0om">
  • <table id="om0om"><noscript id="om0om"></noscript></table>
  • 3 月 19 日下午 2 點,鎖定 NVIDIA AI 網絡中文專場。立即注冊觀看
    高性能計算

    使用 cuTENSOR v1.4 編程分布式多 GPU 張量運算

    今天, NVIDIA 宣布推出 cuTENSOR 1.4 版,它支持多達 64 維張量、分布式多 GPU 張量操作,并幫助改進張量收縮性能模型。現在可以免費下載此軟件。

    下載 cuTENSOR 軟件。

    有什么新鮮事嗎?

    • 支持多達 64 維張量。
    • 支持分布式多 GPU 張量操作。
    • 改進的張量收縮性能模型(即algo CUTENSOR_ALGO_DEFAULT)。
    • 改進了具有整體大收縮維度的張量收縮性能(即增加了平行收縮)。
    • 改進了具有微小收縮維度(<= 8 )的張量收縮性能。
    • 改進了張量收縮(如C[a,b,c,d] = A[b,d] * B[a,c])等外積的性能。
    • 其他錯誤修復。

    有關更多信息,請參閱 cuTENSOR 發行說明

    關于 cuTENSOR

    cuTENSOR 是一個用于張量原語的高性能 CUDA 庫;其主要特點包括:

    • 廣泛的混合精度支持:
      • FP64輸入與FP32計算。
      • FP32通過FP16BF16TF32計算輸入。
      • 復雜的時代需要真正的行動。
      • 共軛(無轉置)支持。

    了解更多

    最近的開發者帖子

    ?
    +1

    標簽

    人人超碰97caoporen国产