526互联
首页
Ai
Java
Python
Android
Mysql
JavaScript
Html
CSS
80G
16GB显卡推理80G大模型
最近看到一篇推文是在不量化、不损失精度的情况下使用一张16G的显卡推理70B的大模型。方案来自于kaggle的一个方案,具体流程为: 1.创建一个空的(例如,没有权重的)模型 2.决定每一层将要去哪里(当有多个设备可用时) 3.在内存中加载其权重的一部分 4.在空模型中加载这些权重 5.将权重移动到 ......
显卡
模型
80G
16
GB
更新时间 2023-10-19
共1篇 :1/1页
首页
上一页
1
下一页
尾页