teradata与greenplum的区别

teradata与greenplum的区别：1、架构不同；2、数据存储不同；3、缩放性不同；4、数据操作不同；5、成本不同；6、兼容性不同。架构不同是指，Teradata是一种对称多处理架构，而Greenplum是一种以共享无阻塞式平行计算为基础的分布式系统。

一、teradata与greenplum的区别

1、架构不同：Teradata是一种对称多处理(Symmetric Multiprocessing，SMP)架构，而Greenplum是一种以共享无阻塞式平行计算(shared nothing massively parallel processing，SN-MPP)为基础的分布式系统。

2、数据存储不同：Teradata是采用块存储方式，而Greenplum是采用元组（tuple）/段（segment）的方式来组织和存储数据的。

3、缩放性不同：Greenplum具有更好的横向扩展能力，可以通过添加更多服务器节点来水平扩展，而Teradata则更适合于垂直扩展。

4、数据操作不同：Teradata使用SQL来执行各种数据操作，包括SELECT、INSERT、UPDATE和DELETE等，而Greenplum支持SQL和PostgreSQL扩展语法。

5、成本不同：Greenplum在总体成本方面较低，主要由于采用了基于开源的软件和硬件组件，而Teradata则相对昂贵。

6、兼容性不同：虽然两者都可以与其他数据源进行集成，但Greenplum更容易与开源工具和技术（例如Hadoop）集成，而Teradata则在这方面缺乏灵活性。

二、teradata简介

Terdata是一个专门为大型仓库应用程序设计的关系数据库管理系统，它基于大规模并行处理(MassivelyParallyProcessing，MPP)架构。它以AMP为基本单元，通过并行优化查询性能。AMPS(AccessModuleProcessor)是用于管理数据库的虚拟处理器。它们从解析器接收执行计划，并能够接收、操作和存储数据。在TeradataSystem中共享预先定义的AMP数量，以执行任务，包括查询、数据存储、备份、索引生成等。

teradata数据库特点：

能够支持海量数据的处理和管理，包括结构化数据、半结构化数据和非结构化数据。
可以实现高性能的数据查询和分析，支持在线分析处理（OLAP）和在线事务处理（OLTP）。
具有高可扩展性和高可靠性，可以随着业务的扩大而无缝扩展。
支持多种数据存储格式，包括行存储、列存储和超级列存储。
支持多种数据安全和隔离控制策略，可以保障企业数据的安全性和隐私性。

三、greenplum简介

greenplum是业界非常快较高性价比的关系型分布式数据库，它在开源的PostgreSQL的基础上采用MPP架构（Massive Parallel Processing，海量并行处理），具有强大的大规模数据分析任务处理能力。GreenPlum作为大数据融合存储平台中众多数据库之一，与其他数据库系统和文件系统一起，为OceanMind提供完整的OceanStorage大数据融合存储解决方案。

greenplum数据库特点：

1、高扩展性

Greenplum数据库采用大规模无共享架构，将多台服务器组装成强大的计算平台，实现高效的海量并行运算。Greenplum数据库可以支持1000个以上的集群，管理的数据规模从TB级到PB级，可以满足多数企业的数据处理需求。

2、高查询性能

Greenplum的高性能不仅来自高效的并行处理框架，还有查询引擎的优化。Greenplum数据库除了支持基于PostgreSQL的查询优化之外，还专门开发了一个新的查询优化器ORCA。

ORCA是一款自顶向下的基于Cascades框架的查询优化器，目前已经成为企业版Greenplum数据库的默认优化器。相比基于PostgreSQL的查询优化器，ORCA查询优化器能使部分查询的性能提升10～1000倍。

3、高可用

Greenplum提供多级容错机制，确保整个系统的高可用性。Master节点通过Standby Master节点进行备份，每个数据节点的Primary Segment实例分别配置一个Mirror Segment实例作为备份，同时确保同一组Primary Segment实例和Mirror Segment实例不在同一物理机上，从而降低因为宕机而导致数据丢失的风险。

4、高效资源管理

Greenplum提供了高效的资源管理机制，根据用户的业务逻辑将资源合理地分配给查询任务，避免查询任务因查询资源不足而得不到响应。

Greenplum资源管理主要包括对并发查询数量的限制，查询执行时内存、CPU资源使用的限制等。Greenplum数据库提供了资源队列（Resource Queue）和资源组（Resource Group）两种资源管理方式，一般使用场景下采用默认配置即可。

5、多态存储

用户可以根据数据热度或者访问模式的不同使用不同的存储方式，以获得更好的查询性能。用户可以为一张表按照一定的规则（比如日期、月份）创建分区表，一张表的各个子分区表可以使用不同的物理存储方式。

6、生态完整

Greenplum数据库拥有完善的SQL标准支持，包括SQL92、SQL99、SQL2003以及OLAP扩展，是对SQL标准支持较好的开源商用数据库系统之一。同时，由于Greenplum数据库基于PostgreSQL，因此也继承了PostgreSQL对于JDBC、ODBC、C、Python API等接口的支持。