最近在使用 time 命令时,无意间发现了一些隐藏的小秘密和强大功能,今天分享给大家。time 在Linux下是比较常用的命令,可以帮助我们方便的计算程序的运行时间,对比采用不同方案时程序的运行性能。
一、Linux下有什么工具可以分析出一个程序的运算时间分布
最近在使用 time 命令时,无意间发现了一些隐藏的小秘密和强大功能,今天分享给大家。
time在Linux下是比较常用的命令,可以帮助我们方便的计算程序的运行时间,对比采用不同方案时程序的运行性能。看似简单的命令,其实蕴藏着很多细节和技巧,来跟着肖邦一起学习吧。
- root@chopin:~$ time find . -name “chopin.txt”
- ……
- real 0m0.174s
- user 0m0.084s
- sys 0m0.084s
可以很清楚看到,find 命令执行的时间为 0.174s,是不是很简单,很方便呢
不过,time 命令输出了三个参数,我们只用到了名列前茅个参数,其它两个参数代表什么含义呢?
这里我来解释一下:
- real:表示的是墙上时间,说白了,其实就是从程序运行开始到结束所经历的时间;
- user:表示程序运行期间,cpu 在用户态所花费的时间;
- sys:表示程序运行期间,cpu 在内核态所花费的时间;
细心的读者会发现,上述案例中的 user + sys 不等于 real,这是怎么回事呢?
其实上边解释的 user 和 sys,是 cpu 执行指令所消耗的时间,并不包含:进程阻塞 IO、调度排队,这些非 cpu 运行时间。
案例中 find 执行查找文件过程中,会有磁盘 IO 读取,这时 cpu 会被释放出来干别的事情,这些 IO 消耗的时间,是不包含在 user 和 sys 统计数据中,所以就出现了 real 时间大于 user + sys 了。
再通过一个示例来验证并加强我们的理解
- root@chopin:~$ time sleep 2
- real 0m2.001s
- user 0m0.000s
- sys 0m0.000s
可以清楚地看到,sleep 命令基本上没有消耗 cpu,程序真实的运行时间就是 2 秒
那我们是不是可以得出如下结论了呢:
real >= user + sys
其实这个结论在单个 cpu 情况下,是正确的。
如果服务器是多个 cpu,你的程序正好可以将多个 cpu 充分利用起来,程序运行期间是多核心并行的,那么 user + sys 统计的 cpu 时间可能就会大于 real 时间啦
所以这 3 个时间之间的关系并不是恒定的,你需要清楚的了解服务器是否为多个核心。
通过统计到的 cpu 消耗时间,我们也可以大概知道,程序运行期间 cpu 利用情况。对于单核,计算密集型的程序,real 会很接近 user 和 sys 时间之和的。
Tips:有些同学可能对操作系统可能不太熟悉,这里简单科普下内核态和用户态的基本概念。
Linux 为使系统更稳定,采取了隔离保护的措施,运行状态分为内核态和用户态:
- 用户态:用户代码不具备直接访问底层资源的能力,需要借助内核提供的系统调用 API。在这种隔离保护下,即使用户程序崩溃,也不会影响整个系统的功能。
- 内核态:内核代码具备最大权限,可执行任意 cpu 指令,不受任何限制。内核态通常是操作系统提供的最底层、最可靠的代码运行的,内核态的代码崩溃是灾难性的,影响整个系统的正常运行。
延伸阅读:
二、MongoDB是什么
MongoDB 是文档型数据库的代表,数据模型基于 Bson,而 Elasticsearch 的文档数据模型是 Json,Bson 本质是 Json 的一种扩展,可以相互直接转换,且它们的数据模式都是可以自由扩展的,基本无限制。MongoDB 本身定位与关系型数据库竞争,支持严格的事务隔离机制,在这个层面实际上与 Elasticsearch 产品定位不一样,但实际工作中,几乎没有公司会将核心业务数据放在 MongoDB 上,关系型数据库依然是名列前茅选择。