Posts by Zhilin Wang
生成式人工智能/大語言模型
2024年 10月 3日
新的獎勵模型有助于改善 LLM 與人類偏好的匹配
從人類反饋中進行強化學習(Reinforcement learning from human…
1 MIN READ
對話式人工智能
2023年 11月 27日
宣布推出 HelpSteer:用于構建實用 LLM 的開源數據集
NVIDIA 最近宣布了 NVIDIA NeMo SteerLM 技術,它是 NVIDIA NeMo 的一部分。
3 MIN READ
對話式人工智能
2023年 10月 11日
宣布推出 SteerLM:在推理期間自定義 LLM 的簡單實用技術
近年來,隨著大語言模型 (LLMs)例如 GPT-3、Megatron-Turing、Chinchilla、PaLM-2、
3 MIN READ