windows系统下校验测序数据MD5?

发布时间 2023-05-16 22:24:27作者: 米源MY

本地上传测序文件到Linux系统,做md5时发现有少数文件失败。

$ cat md5.check
84305_FDSW190448400-1a_1.fq.gz: OK
84305_FDSW190448400-1a_2.fq.gz: FAILED
md5sum: WARNING: 1 computed checksum did NOT match

可能是上传有误,也可能是本地测序文件本身不完整。但是文件太大,在没搞清楚源头之前,不宜再次上传。这时,在本地windows下对失败文件做MD5检验。

windows下安装的git没有md5sum,但windows自带有certutil校验:

certutil -hashfile  <文件名>  <hash类型>

用cmd命令行或git如下:

$ certutil -hashfile 84305_FDSW190448400-1a_2.fq.gz md5
MD5 的 84305_FDSW190448400-1a_2.fq.gz 哈希:
4bc35e5c5561efcd99fe3911e7488f11
CertUtil: -hashfile 命令成功完成。

比较下原始文件中的MD5,两者是一样的。

$ cat MD5_84305_FDSW190448400-1a.txt
f11f1eeadb5d75755eacad66136f48c4  84305_FDSW190448400-1a_1.fq.gz
4bc35e5c5561efcd99fe3911e7488f11  84305_FDSW190448400-1a_2.fq.gz

因此,判断是传输错误。看看是不是中断导致,先不覆盖,续传后校验再看,这样更省时间。

重新传完后,校验正确。

$ md5sum -c MD5_84305_FDSW190448400-1a.txt
84305_FDSW190448400-1a_1.fq.gz: OK
84305_FDSW190448400-1a_2.fq.gz: OK

ref:https://blog.csdn.net/ThinkAboutLife/article/details/110384620