Abhinav Khattar – NVIDIA 技術博客
http://www.open-lab.net/zh-cn/blog
閱讀開發者創建的最新技術信息、頭條新聞 和內容。
Thu, 19 Oct 2023 06:25:05 +0000
zh-CN
hourly
1
196178272 -
宣布推出 SteerLM:在推理期間自定義 LLM 的簡單實用技術
http://www.open-lab.net/zh-cn/blog/announcing-steerlm-a-simple-and-practical-technique-to-customize-llms-during-inference/
Wed, 11 Oct 2023 06:22:13 +0000
http://www.open-lab.net/zh-cn/blog/?p=8024
Continued]]>
近年來,隨著大語言模型 (LLMs)例如 GPT-3、Megatron-Turing、Chinchilla、PaLM-2、Falcon 和 Lama 2 在自然語言生成方面取得了顯著進展。然而,盡管這些 LLM 能夠生成類似人類的文本,但它們可能無法提供符合用戶偏好的有用且細致入微的響應。 當前改進大語言模型 (LLM) 的方法包括監督精調 (SFT),然后是從人類反饋中進行強化學習 (RLHF)。雖然 RLHF 可以提高性能,但它有一些局限性,包括訓練復雜性和缺乏用戶控制。 NVIDIA 研究團隊為了克服這些挑戰,開發并發布了 SteerLM,這是一種新的四步技術,可以簡化 LLM 的自定義,并根據您指定的屬性動態轉向模型輸出,作為 NVIDIA NeMo 的一部分。本文將深入探討 SteerLM 的工作原理,為什么它標志著一個顯著的進步,
Source
]]>
8024
人人超碰97caoporen国产