木筏

玩不起RLHF?港科大开源高效对齐算法木筏,GPT扩散模型都能用zz

开源大模型火爆,已有大小羊驼LLaMA、Vicuna等很多可选。 但这些羊驼们玩起来经常没有ChatGPT效果好,比如总说自己只是一个语言模型、没有感情blabla,拒绝和用户交朋友。 归根结底,是这些模型没有ChatGPT那么对齐(Alignment),也就是没那么符合人类用语习惯和价值观。 为此 ......
木筏 算法 模型 RLHF GPT
共1篇  :1/1页 首页上一页1下一页尾页