lora rlhf

使用 LoRA 进行 Stable Diffusion 的高效参数微调

LoRA: Low-Rank Adaptation of Large Language Models 是微软研究员引入的一项新技术，主要用于处理大模型微调的问题。目前超过数十亿以上参数的具有强能力的大模型 (例如 GPT-3) 通常在为了适应其下游任务的微调中会呈现出巨大开销。 LoRA 建议冻结预 ......

Diffusion 参数 Stable LoRA更新时间 2023-03-22

共91篇 :4/4页 首页上一页1234下一页尾页

526互联

lora rlhf

使用 LoRA 进行 Stable Diffusion 的高效参数微调