Posts by Cherie Wang
生成式人工智能/大語言模型
2025年 3月 6日
使用重排序微服務提升信息檢索準確性和降低成本
需要高性能信息檢索的應用涉及各個領域,包括搜索引擎、知識管理系統、AI 代理和 AI 助手。這些系統需要準確且計算高效的檢索流程,
2 MIN READ
數據中心/云端
2024年 11月 15日
NVIDIA NIM 1.4 現已部署可用,推理速度提升 2.4 倍
隨著 生成式 AI 重塑各行各業,對可立即部署的高性能推理的需求也在不斷增長。 NVIDIA NIM 為 AI…
1 MIN READ
生成式人工智能/大語言模型
2024年 2月 23日
評估適用于企業級 RAG 的 Retriever
關于設計和評估的對話 檢索增強生成(RAG) 系統是一個漫長而多方面的討論。即使我們單獨研究檢索,開發者也會有選擇地使用許多技術,
3 MIN READ