Pytorch模型结构修改

发布时间 2023-12-21 17:16:46作者: 365/24/60

1. Var方差在pytorch中的差别:

tlist = input.tolist()
print(input)
print(np.mean(tlist), np.var(tlist))
print(torch.mean(input), torch.var(input))


可以看到numpytorch求出来的 **Var **与 **Mean **有差别
原因:如下图为 torch.var 官网描述,其中存在一个矫正 correction【version2加入,默认为1】

refer: https://pytorch.org/docs/stable/generated/torch.var.html

2. 模型修改中使用到 nn.Parameter,但参数并未更新

self.Intra_paras = nn.Parameter(torch.tensor( [ float('-100') for i in range(num_blocks) ]), requires_grad=True)
xs = self.Intra_paras.item() * xs

原因:模型训练流程中,使用的时item(),传入更新图的是实际值
解决:unsqueeze维度之后,直接 *
其它相关确认方法:

  1. 查看 require_grad 是否为 true
  2. 查看 optim 优化器是否把 model 参数添加