生信log38|拿到的数据就是想要的数据吗?-数据校验

2023-08-06  本文已影响0人  小周的万用胶囊

最近需要下载和传输的数据,还有传输数据,过程中涉及到好多验证的问题,因此小记这一篇,关于验证的原理有机会再探讨,本log不作赘述。

为什么需要校验数据及导致数据不一致的原因是什么

什么场景下数据要进行校验

怎么校验-策略与常用的方法

目前使用最多的是md5校验,NCBI的FTP存储地址提供的序列文件一般都带有XXX.md5

MD5

md5sum 文件名

SHA1

sha1sum 文件名

SHA256

sha256sum 文件名

Cosmic数据库的例子
这个官方是见过比较严谨的了,NCBI一般只提供md5的校验,但这个官网是少有能提供由三种不同校验方式生成校验文件的

Cosmic数据库提供的文件

题外总结

这只是信息分析小细节也是我的一个小小记录,数据分析的过程就是一个实验和生产过程,实验过程中谨慎谨慎再谨慎,严谨严谨再严谨,至少交出来的数据是保证可信度的。

上一篇 下一篇

猜你喜欢

热点阅读