Posts by Karthik Mandakolathur
數據科學
2022年 2月 28日
使用 NVIDIA Collective Communication Library 2.12 將所有 all2all 性能翻倍
集體通信是現代分布式人工智能培訓工作(如推薦系統和自然語言處理)的一個關鍵性能組成部分。
3 MIN READ
人工智能/深度學習
2021年 12月 1日
通過全堆棧優化提升 NVIDIA MLPerf Training v1.1 的性能
自 v1.0 以來已經過去了五個月,所以是時候進行新一輪 MLPerf 培訓基準了。在這個 v1.1 版本中,
5 MIN READ