tar、gzip、zip、jar是什么，怎么查看？

简介

如果你是后端程序员，我想你一定见过 *.tar.gz 、 *.zip 、 *.jar 后缀的文件吧，这些都是压缩文件，那这些文件都是怎么生成的，又有哪些关键区别呢？本文将带你一起了解这些文件和配套的操作命令，以及其经常使用的场景。

tar与gzip

Linux上最常见的压缩文件就是 *.tar.gz 了，各种开源软件常以这种格式发布源码或程序，所以作为一名后端开发，还是很有必要了解一下的。

首先，可以发现这个文件后缀名有两段，即 .tar 和 .gz ，取这个名称也是有原因的，因为它的制作过程就分为两个部分，如下：

使用tar将目录打包成单个 .tar 文件

# 将applogs目录打包为applogs.tar文件
# 其中-c代表打包、-f指定打包文件名
$ tar -cf applogs.tar applogs/

# 可以发现，打包文件大小与目录占用大小差不多，因为tar仅仅是把目录中文件拼成单个文件，默认并不压缩  
$ du -sh applogs/ applogs.tar
177M    applogs/
175M    applogs.tar

使用gzip将 .tar 文件压缩为 .gz 文件

# 使用gzip压缩，会生成applogs.tar.gz文件
$ gzip -k applogs.tar

# 可以发现压缩后文件体积明显变小
$ du -sh applogs.tar applogs.tar.gz
175M    applogs.tar
8.8M    applogs.tar.gz

这就是 *.tar.gz 文件的制作过程，其实这两步使用tar命令可以简化为一步，如下：

# 打包并压缩，其中-z代表打包后再使用gzip压缩
$ tar -czf applogs.tar.gz applogs/

# 解压到当前目录
$ tar -xzf applogs.tar.gz -C ./

压缩日志文件

另外，由于日志文件内容一般都有很高重复率，这导致Linux上经常会将后端系统产生的历史日志文件压缩后存储起来，这样可以大幅减低磁盘空间占用。

基于这种情况，Linux上又诞生了一批查看压缩日志文件的命令，如zcat、zgrep、zless等，如下：

# 自动解压文件，并将其中文件内容输出
$ zcat applogs.tar.gz

# 自动解压文件，并在其中搜索，用法和grep类似
$ zgrep -a 'error' applogs.tar.gz

这比傻乎乎地先解压文件，再在文件中搜索要高效多了。

tar与其它压缩算法

另外，除了gzip外，tar其实也可以搭配其它压缩算法，像bzip2、xz等等，如下：

-j, --bzip2                filter the archive through bzip2
  -J, --xz                   filter the archive through xz
      --lzip                 filter the archive through lzip
      --lzma                 filter the archive through xz
      --lzop                 filter the archive through lzop
  -z, --gzip, --gunzip, --ungzip   filter the archive through gzip
      --zstd                 filter the archive through zstd
  -Z, --compress, --uncompress   filter the archive through compress

zip与jar

zip同样是一种常见的压缩文件格式，后缀是 *.zip ，与上面tar、gzip不同的是，zip将打包与压缩两个过程融合在一起了，在Linux下对应的操作命令是 zip 与 unzip ，如下：

# 创建zip压缩文件
$ zip -r applogs.zip applogs/

# 查看zip压缩文件中有哪些文件
$ unzip -l applogs.zip
Archive:  applogs.zip
  Length      Date    Time    Name
---------  ---------- -----   ----
        0  2022-09-17 12:58   applogs/
    99166  2022-09-16 18:20   applogs/demo.2022-09-16.0.log
 13177092  2022-09-17 13:37   applogs/demo.2022-09-17.0.log
      948  2022-08-09 15:08   applogs/demo.log
...
---------                     -------
203039002                     140 files

# 解压zip文件，-d指定解压目录
$ unzip applogs.zip -d ./

与gzip类似的是，zip也配套了一批方便特定场景使用的命令工具，如zipinfo、zipgrep等，如下：

# zipinfo查看zip文件包含哪些文件
$ zipinfo applogs.zip
Archive:  applogs.zip
Zip file size: 9573195 bytes, number of entries: 140
drwxrwxrwx  3.0 unx        0 bx stor 22-Sep-17 12:58 applogs/
-rwxrwxrwx  3.0 unx    99166 tx defN 22-Sep-16 18:20 applogs/demo.2022-09-16.0.log
-rwxrwxrwx  3.0 unx 13177092 tx defN 22-Sep-17 13:37 applogs/demo.2022-09-17.0.log
-rwxrwxrwx  3.0 unx      948 tx defN 22-Aug-09 15:08 applogs/demo.log
...
140 files, 203039002 bytes uncompressed, 9546235 bytes compressed:  95.3%

# zipgrep自动解压文件，并在其中搜索，用法和grep类似
$ zipgrep 'error' applogs.zip

查看jar文件

目前，绝大多数java项目都是基于spingboot的，众所周知，spingboot会将项目打包成单个jar文件来部署，但其实jar文件本质上就是zip格式，它相比zip文件只是多了一个 META-INF/MANIFEST.MF 文件而已，如下：

$ unzip -p app.jar META-INF/MANIFEST.MF
Manifest-Version: 1.0
Spring-Boot-Classpath-Index: BOOT-INF/classpath.idx
Implementation-Version: 0.0.1-SNAPSHOT
Spring-Boot-Layers-Index: BOOT-INF/layers.idx
Start-Class: com.example.demo.DemoApplication
Spring-Boot-Classes: BOOT-INF/classes/
Spring-Boot-Lib: BOOT-INF/lib/
Build-Jdk-Spec: 1.8
Spring-Boot-Version: 2.4.0
Created-By: Maven Jar Plugin 3.2.0
Main-Class: org.springframework.boot.loader.JarLauncher

如上所示， MANIFEST.MF 文件指定了jar包的 Main-Class ，这样当执行 java -jar app.jar 时，java就知道去哪个类找main方法了，而spingboot打包的jar，无非就是将启动类换成了自己的而已。

而很多时候，我们需要确认下jar文件里面的内容，比如我想看一下app.jar里被spingboot内嵌的tomcat的线程池配置大小，可如下查看：

$ zipgrep 'max-thread' app.jar 
BOOT-INF/classes/application.yml:    max-threads: 500

这可比jdk自带的jar命令方便多了，如果你是java开发同学，这个命令应该成为你开发工具箱中的一员。

总结

ok，压缩文件与命令介绍得差不多了，简单总结一下：

tar、gzip：用于打包或解压 *.tar.gz 文件的命令，虽然它们是两个命令，但几乎都是一起使用的。
zip、unzip：用于打包或解压 *.zip 文件的命令，值得注意的是，它们同样可处理 *.jar 文件，且在搜索场景中，使用zipgrep更方便。

less命令其实可以直接打开这些压缩文件，它甚至可以打开png、pdf等广义上的压缩文件！

另外，Linux平台上其实还有一些其它的压缩命令，如bzip2、xz、7z、rar等，就不一一介绍了，感兴趣可查看Linux man文档。

原创：扣钉日记（微信公众号ID：codelogs），欢迎分享，转载请保留出处。

本文内容仅供个人学习/研究/参考使用，不构成任何决策建议或专业指导。分享/转载时请标明原文来源，同时请勿将内容用于商业售卖、虚假宣传等非学习用途哦～感谢您的理解与支持！

链接: https://fly63.com/article/detial/12151