526互联
首页
Ai
Java
Python
Android
Mysql
JavaScript
Html
CSS
Anthropic
解密Prompt7. 偏好对齐RLHF-OpenAI·DeepMind·Anthropic对比分析
RLHF是针对有用,无害,事实性等原则,把模型输出和人类偏好进行对齐的一种方案。以OpenAI为基础,本章会对比DeepMind, Anthropic在RLHF步骤中的异同,试图理解RLHF究竟做了啥 ......
偏好
RLHF-OpenAI
183
Anthropic
DeepMind
更新时间 2023-05-23
共1篇 :1/1页
首页
上一页
1
下一页
尾页