526互联
首页
Ai
Java
Python
Android
Mysql
JavaScript
Html
CSS
DDPO
使用 DDPO 在 TRL 中微调 Stable Diffusion 模型
引言 扩散模型 (如 DALL-E 2、Stable Diffusion) 是一类文生图模型,在生成图像 (尤其是有照片级真实感的图像) 方面取得了广泛成功。然而,这些模型生成的图像可能并不总是符合人类偏好或人类意图。因此出现了对齐问题,即如何确保模型的输出与人类偏好 (如“质感”) 一致,或者与那 ......
Diffusion
模型
Stable
DDPO
TRL
更新时间 2023-10-23
共1篇 :1/1页
首页
上一页
1
下一页
尾页