数据仓库vs数据集市

信息图表

当公司考虑数据仓库和数据集市之间的区别时, 他们将数据库与集成数据和数据竖井进行比较. 在十大电子游艺平台首选的比较信息图中了解更多关于差异的信息,并了解为什么Teradata推荐一个统一的数据存储和数据分析生态系统.

数据仓库vs数据集市

数据仓库和数据集市的区别是什么?

数据仓库是一个 设计模式和体系结构 用于共享和详细的数据. 它有很多特点. 数百个数据源和应用程序可以将所有主题领域的数据发送到相同的数据仓库, 它在哪里被集成并在所有用户之间共享. 

数据集市是一个 具有单一焦点区域的数据存储库. 它提供数据仓库的一个子集,并服务于一小部分用户. 数据集市只提供数据仓库中整体数据的一小部分. 

数据仓库vs数据集市对比信息图

数据仓库比数据集市提供什么数据?

1单, 集成, 连接的数据仓库生态系统,汇集所有数据, 无论学科领域如何. 这为所有用户提供了一个真实的来源. 

每个学科领域1个数据集市. 这可能会导致数据孤岛,每个孤岛都服务于一小群用户. 

这可能是具有相同信息的1,000个数据竖井或1个数据仓库之间的差异. 

他们通常有多少张桌子?

> 4,000 tables for a data warehouse

< 20 tables for a data mart

它们通常存储多少数据?

> 100GB data warehouse

< 100GB data mart

业务和IT影响是什么?

数据仓库将所有数据汇集在一起, 这是洁净的, 管理, 集成, 和治理,以获得业务的完整视图.

数据集市创建了竖井,这增加了成本、复杂性和数据移动. 数据集市通常有重复和冗余的数据, 这导致了“数据漂移?,或数据意外更改并破坏流程. 

Teradata推荐什么?

Teradata倡导 让数据成为公司最大的资产. 这需要打破障碍和竖井,并为分析聚合所有数据. 

Teradata建议 用于企业分析的互联多云数据平台 结合一切, 包括数据的湖泊, 数据集市, 数据仓库, 分析, 以及新的数据源和类型. 这使得所有数据都可以搜索和使用. 任何部门的任何用户都可以在任何时间针对任何数据提出任何问题.