数据结构需与数据仓库及其他以数据库为中心的技术共存

blog-image

自从 IT 诞生以来,企业就需要获得一个关于来自多个应用程序的数据的集成、统一视图,而数据仓库长期以来一直是解决这一问题的首选方案。最近,企业也开始使用数据湖和数据中心来解决这一问题,数据结构则是最新的替代方案。有一个问题引人深思,即数据结构会不会淘汰数据仓库和数据湖等其他解决方案?会不会取而代之?

以数据库为中心的解决方案

大部分事务数据库只能支持一个应用程序,但无论是人力资源、客户关系管理、销售还是运输都各有专门的应用程序。决策者需要集成来自多个应用程序的数据,才能全面了解他们正在分析的数据。操作用户也需要集成的数据访问权限,来获取客户、订单或患者的 360 度全方位视图,并了解其他信息。

数据仓库、数据湖和数据中心是如何解决这一挑战的呢?它们将来自多个系统的数据复制到一个集中数据库,然后为数据使用者提供该数据库的访问权限。

数据结构的优势

数据结构并非采用以数据库为中心的架构,因此工作方式有所不同。借助数据结构,您可以将应用程序封装在服务层,然后在服务层呈现所需的集成、统一数据视图。它可以隐藏应用程序使用的所有不同技术、语言和 API,让数据使用者轻松访问数据。正如 Gartner 所言,数据结构可提供顺畅无阻的数据访问。

数据结构和以数据库为中心的解决方案之间的重要功能差异在于,前者除了提供数据查询服务之外,还可以为插入、更新和删除数据提供支持服务。另外,数据结构也支持实时访问数据,因为其服务可直接访问应用程序,而无需访问包含复制数据的数据库。

数据库并不能替代数据仓库,数据中心也不能替代数据湖。它们各有所用,虽然某些用途可能有所重叠。但数据结构能取代所有这些以数据库中心的解决方案吗?答案很简单:不能。

数据结构要求

要取得成功,数据结构必须支持各种各样的数据使用者,包括网站、门户、移动应用程序、仪表板、自助服务 BI 和数据科学来源。因此,数据结构的服务必须能应对多种挑战,例如:

  • 逻辑必须能处理数据不一致、错误和丢失问题。此逻辑与提取、转换和加载 (ETL) 程序中常见的逻辑非常相似。
  • 如果应用程序不能跟踪历史数据,则必须存储在服务层。
  • 连处理现有工作负载都吃力的应用程序肯定无法处理数据结构生成的额外工作负载。
  • 数据必须进行匿名化和/或假名化处理,以确保符合数据隐私法规的规定。
  • 数据结构的所有使用者可分为两种:以对象为导向的数据使用者和以集为导向的数据使用者。以对象为导向的数据使用者仅操作或查询一个业务对象、记录或文档,比如一个订单、一名客户和一名患者。以集为导向的数据使用者则处理多组对象,例如一名客户的所有订单或者按月按地区划分的合计净销售额。同时支持这两种数据使用者(尤其是第二种)并非易事。

要实施能解决以上挑战的服务,很可能需要在服务层中存储数据。例如,如果一个应用程序无法跟踪历史记录,而一个数据结构的一些使用者需要使用该历史记录来开展分析,那么就需要将该历史记录存储起来,这时候,数据库就能派上用场。而且,要为以集为导向的数据使用者提供高效的支持,则必须将数据存储在能够快速执行这些查询的数据库中。在解决一些挑战时,就会需要用到存储在服务层的数据。

共存

数据结构并非是一个由编程代码组成的服务层。在现实应用中,数据结构包含数据仓库、数据湖或者两者兼有,数据结构也可以像应用程序一样访问数据仓库。换而言之,数据结构可以与以数据库为中心的解决方案共存。在构建数据结构服务时,开发人员也不得不允许这种共存。

Rick van der Lans
Rick van der Lans Independent Industry Analyst

 2022/09/06

添加新评论

验证码
此问题用于检测您是否是真正的访客并防止自动提交垃圾邮件。
Image CAPTCHA
输入图片中显示的字符。

立刻行动

充分挖掘您的数据,获取实时洞察,
即刻开启数字化转型之旅!
18518356610


18518356610