diffusion扩散模型\datawhale组队学习——v2-抄别人代码还要矫情一下

发布时间 2023-10-20 12:40:09作者: windiest

如果想学diffusion,又没有买纸质书咋办捏?

datawhale为我们提供了大佬的中文笔记!

学习来源:

https://relph1119.github.io/my-team-learning/#/diffusion_models_learning51/ch03/ch03

 

甚至比看github的代码还方便。

但是又不得不矫情一下,跟着做还有点问题。(小弟就不放大佬的笔记了,下面只有遇到的问题与解决的办法)

 

为了节省阅读时间,以下内容:
安装一个diffuser库(可能有点用)——第三第四章的运行环境前置安装

读代码的废话(完全没用)

 

 

 

 

 

 

 

 

 

 

 

首先,这些公式完全看不懂。希望懂得朋友读到这里能帮忙解释一下。

最下面的“优化目标公式”,是啥意思,为啥没有min,还能求最小值呢?难道目标是让L最小?

 

 

第二, 实战第一步卡死,环境准备缺失

笔记中:

 实际上:我diffuser呢?

 解决办法:

 随后第一段就通过了。但只是colab通过。本地又不行,如果有时间再研究本地。colab挺好用的。

第四章问题一样,而且这里可能不得不用colab,因为第四章后面要登陆huggingface,一次FQ就OK。

 

 

 

 

代码相关的废话:

 

第三章:只能看明白中间的加噪,还有模型的去噪效果。如何训练的不懂。而且也没有体现公式原理啥的,训练是函数执行的。

 

 

 

画图prompt:

 

A cool cybernetic cat,glowing neon fur,bionic eyes,mechanical tail,urbanbackground,cityscape reflections,high-tech,glitchy cyberpunk,metallic sheen,electricblue,urban glow,nighttime,chromatic aberration,vivid cyber colors,streetlight reflections.(best quality,4k,8k,highres,masterpiece:1.2),ultra-detailed,(realistic,photorealistic,photo-realistic:1.37),HDR,UHD,studio lighting,ultra-fine painting,sharp focus,physically-basedrendering,extreme detail description,professional,bokeh.

乱七八糟。

因为没有负面提示词,会随机产出各种奇怪的东西

 

a cut cat in a cyberpunk city, high details

也是不行

 

full body, long shot, a cate in a cyberpunk city, ....忘了

效果也一般。

 

 但也是矮子里面挑高个了。