Schulman

John Schulman：RLHF的实施与挑战 —— 通过强化学习缓解大模型输出幻觉(Hallucinations)的思考

John Schulman，研究科学家、OpenAI联合创始人；加州大学伯克利分校计算机科学博士，师从Pieter Abbeel。现领导OpenAI强化学习团队。本文是对John Schulman(下文中简称为JS)的报告《Reinforcement Learning from Human Fee ......

Hallucinations 幻觉 Schulman 模型 John更新时间 2023-08-03

共1篇 :1/1页 首页上一页1下一页尾页

526互联

Schulman

John Schulman：RLHF的实施与挑战 —— 通过强化学习缓解大模型输出幻觉(Hallucinations)的思考