gzip解压NR库的时候,报错格式违法的解决方法:1、检查NR库文件是否下载正确;2、使用工具比对文件校验和值是否相同;3、确认解压命令的正确性。检查NR库文件是否下载正确是指NR 库文件应该是gz格式的,如果文件格式不正确,会导致解压失败。
一、gzip解压NR库的时候,报错格式违法的解决方法
1、检查NR库文件是否下载正确
NR 库文件应该是 gz 格式的,如果文件格式不正确,会导致解压失败。检查一下下载的 NR 库文件是否正确。如果不正确,尝试重新下载。
2、使用工具比对文件校验和值是否相同
文件在传输或下载过程中可能会发生损坏,也可能导致解压失败。尝试重新下载 NR 库文件,或者下载同样的文件来比较校验结果。在下载 NR 库文件之后,可以使用 MD5 校验和工具或 SHA1 校验和工具来比对文件校验和值是否相同。
3、确认解压命令的正确性
如果下载的 NR 库文件没有问题,则应该确认解压命令的正确性。在解压命令中指定正确的参数,例如 “-d” 告诉 gzip 解压缩源文件并将解压缩的文件放入目标目录中。
二、Linux gzip命令
1、简介
Linux gzip命令用于压缩文件。gzip是个使用广泛的压缩程序,文件经它压缩过后,其名称后面会多出”.gz”的扩展名。
2、语法
gzip [-acdfhlLnNqrtvV][-S <压缩字尾字符串>][-<压缩效率>][--best/fast][文件...] 或 gzip [-acdfhlLnNqrtvV][-S <压缩字尾字符串>][-<压缩效率>][--best/fast][目录]
参数:
- -a或–ascii:使用ASCII文字模式。
- -c或–stdout或–to-stdout:把压缩后的文件输出到标准输出设备,不去更动原始文件。
- -d或–decompress或—-uncompress:解开压缩文件。
- -f或–force:强行压缩文件。不理会文件名称或硬连接是否存在以及该文件是否为符号连接。
- -h或–help:在线帮助。
- -l或–list:列出压缩文件的相关信息。
- -L或–license:显示版本与版权信息。
- -n或–no-name:压缩文件时,不保存原来的文件名称及时间戳记。
- -N或–name:压缩文件时,保存原来的文件名称及时间戳记。
- -q或–quiet:不显示警告信息。
- -r或–recursive:递归处理,将指定目录下的所有文件及子目录一并处理。
- -S<压缩字尾字符串>或—-suffix<压缩字尾字符串>:更改压缩字尾字符串。
- -t或–test:测试压缩文件是否正确无误。
- -v或–verbose:显示指令执行过程。
- -V或–version:显示版本信息。
- -<压缩效率>:压缩效率是一个介于1-9的数值,预设值为”6″,指定愈大的数值,压缩效率就会愈高。
- –best:此参数的效果和指定”-9″参数相同。
- –fast:此参数的效果和指定”-1″参数相同。
3、实例
压缩文件:
[root@runoob.com a]# ls //显示当前目录文件 a.c b.h d.cpp [root@runoob.com a]# gzip * //压缩目录下的所有文件 [root@runoob.com a]# ls //显示当前目录文件 a.c.gz b.h.gz d.cpp.gz [root@runoob.com a]#
接范例1,列出详细的信息:
[root@runoob.com a]# gzip -dv * //解压文件,并列出详细信息 a.c.gz: 0.0% -- replaced with a.c b.h.gz: 0.0% -- replaced with b.h d.cpp.gz: 0.0% -- replaced with d.cpp [root@runoob.com a]#
接范例1,显示压缩文件的信息:
[root@runoob.com a]# gzip -l * compressed uncompressed ratio uncompressed_name 24 0 0.0% a.c 24 0 0.0% b.h 26 0 0.0% d.cpp
延伸阅读1:NR库是什么
NR(Non-Redundant Protein Sequence Database)非冗余蛋白库,所有GenBank+EMBL+DDBJ+PDB中的非冗余蛋白序列,对于所有已知的或可能的编码序列,NR记录中都给出了相应的氨基酸序列(通过已知或可能的读码框推断而来)以及专门蛋白数据库中的序列号。NR库相当于一个以核酸序列为基础的交叉索引,将核酸数据和蛋白数据联系起来。