526互联
首页
Ai
Java
Python
Android
Mysql
JavaScript
Html
CSS
Schulman
John Schulman:RLHF的实施与挑战 —— 通过强化学习缓解大模型输出幻觉(Hallucinations)的思考
John Schulman,研究科学家、OpenAI联合创始人;加州大学伯克利分校计算机科学博士,师从Pieter Abbeel。现领导OpenAI强化学习团队。 本文是对John Schulman(下文中简称为JS)的报告《Reinforcement Learning from Human Fee ......
Hallucinations
幻觉
Schulman
模型
John
更新时间 2023-08-03
共1篇 :1/1页
首页
上一页
1
下一页
尾页