为什么列存储数据库读取速度会比传统的行数据库快

列存储的数据库更适合OLAP，行存储的数据库更适合OLTP所谓的快只是针对于进行olap操作而言。我们知道，数据在存储中的基本单位为页，这也是进行数据读取时候基本单位，一次读取就是一次IO操作。

一、为什么列存储数据库读取速度会比传统的行数据库快

列存储的数据库更适合OLAP，行存储的数据库更适合OLTP所谓的快只是针对于进行olap操作而言。我们知道，数据在存储中的基本单位为页，这也是进行数据读取时候基本单位，一次读取就是一次IO操作。

以行方式查询（在有适当的索引情况下)，那么，执行一次以上查询，只需要扫描一次page1就可以了。

以列方式查询，需要投其扫描page1 和page2共2次，分别取得字段1，字段2的单行值。

OK，我们换成olap的典型查询

select avg(字段2) from table

–（注意，这里假设字段2为一个整型数据，而且无where条件限制，即需要扫描全部数据）

对于行存储，这个查询需要两次IO将全部数据放入内存后，进行页间数据的跳读（类随机读取)，对于列存储，只需要一次IO将page2放入内存后进行连续读取，如果字段2还有多页的话，也都是进行的物理连续读取

也就是说，在进行olap操作时候，不仅是减小了IO次数，而且把随机读取变为了连续读取。

列式存储把相同类型的数据归在一起，压缩比可以很高，通常能到10%~25%。数据库的瓶颈通常在IO，很高的压缩比，可以大大减轻数据读取的压力，提高响应速度。

除去字符串类型，其他类型的字段通常是固定长度的，而且在磁盘和内存的字节顺序通常是一致的，可以直接映射，省去了解析的过程。而在行存储中，只要有变长的字段存在，需要逐行逐字段的解析。

延伸阅读：

二、列存储的特点

在读取数据时，SQL Server每次都把所需数据所在的整个Page读取到内存中，Page是数据读取的最小单位。如果采用行存储，每一个Page都存储所有列的数据，每行的Size决定了单个Page能够存储的数据行数量。

我们可以粗略计算一下，如果一个数据行有10列，每列的平均Size是10B，一行的Size是100B，那么单个Page非常多存储80行（8060B/100B）；如果采用列存储模式，那么单个Page可以存储806行（8060B/10B）。就单个Page存储的数据行数量而言，列存储是行存储的10倍，SQL Server引擎把一个Page读取到内存中，能够获取的数据行数量成10倍增加。

因此，采用列存储模式时，每一个Page能够存储更多的数据行。在加载列存储数据时，SQL Server只需要消耗少量的IO，就能把某一列的全部数据加载到缓存中。当从列很多的大表中读取几个列时，相比传统的行存储（Row Store）模式，列存储（Column Store）能够成千上万倍地提高数据的读取速度和查询性能。