Posts by Disha Mehra
生成式人工智能/大語言模型
2024年 12月 18日
NVIDIA?TensorRT-LLM?現支持?Recurrent Drafting,實現?LLM?推理優化
Recurrent Drafting (簡稱 ReDrafter) 是蘋果公司為大語言模型 (LLM) 推理開發并開源的一種新型推測解碼技術,
2 MIN READ
人工智能/深度學習
2021年 11月 9日
使用 NVIDIA TAO 工具包構建和部署對話 AI 模型
對話式人工智能是一組技術,能夠在人類和設備之間基于最自然的界面(語音和自然語言)進行類似人類的交互。
7 MIN READ