中台的概念已经数年了,不少公司也在内部开发或者引入第三方做自己的中台。对于一个新的产品来讲,并不是很能理解中台的意义。这篇文章,作者分享了为什么要做数据中台的意义和价值,与大家分享。
我们都知道,随着政府、企业、园区等信息化系统如火如荼的持续建设,数据问题逐渐凸显,我们从数据现状,数据应用,技术路径等方面着手,浅析数据中台产品的建设意义。
一、改善数据现状
以下是未引入数据中台时信息系统中数据的现状。
1. 数据质量不佳
因为系统建设的先后问题、建设团队不同等问题会导致数据统计口径不一致,比如同名不同意或同意不同名,例如有的系统区分性别是男/女,有的是先生/女士。
业务数据缺失,有些业务系统对关键流程未做校验,导致关键数据缺失。比如某些数据找不到上报路径,是云云对接的数据还是机器直报的数据无从得知。
数据脏乱差,比如重复数据、无效数据、空数据、不合法数据等,这些数据无法正常使用,需要进行特定处理。
2. 数据架构落后
因为系统建设的历史问题,信息化进程并非从上至下统一规划,导致系统间相互割裂,无法实现数据共享,关联数据又存储在不同系统中,正所谓“数据孤岛”。
随着业务系统数据量的日渐庞大,操作、查询、导出等操作效率越来越低。
通过引入数据中台,经过数据治理模,持续改善数据质量,优化数据架构。
二、全面挖掘数据资产,改善数据应用面临的问题
近年来,“数据要素”,“数字资产”等概念不断被提及,显见数据的重要性,那么在我们现有信息化系统基础上数据资产的应用面临的问题有哪些?
1. 开发运营成本升高
人力成本
随着系统的正常运营,新的需求被不断提出,而系统的开发和运维依赖大量的工程师,并需配套的服务人员,人员数量不断增多,人力成本居高不下。
时间成本
系统的开发只能按照计划线性推进,而随着业务的复杂度逐渐增加,相同功能需要的时间越来越多,边际效用递减。
沟通成本
系统的开发和运维依赖于人之间的协作和配合,并要大量的工具、文件作为辅助,而系统数量的增加,业务复杂度的提高都导致了沟通成本的逐渐上升。
2. 数据资产浪费
因为数据孤岛问题,很多运营数据、管理数据、服务数据只能孤零零地存储在业务系统中,无法为业务的精细化发展作分析支撑,更不能作为战略决策的依据,造成了宝贵数据资源的浪费。
通过引入数据中台,可以将数据融合并自动化的处理,节省新业务导致的开发运营成本,也盘活了数据资产,挖掘了数据价值,为企业的决策分析提供支撑依据。
三、从技术角度看数据中台的必要性
数据中台中数据的存储、处理用到数仓技术,可以比对一下传统数据库和数仓的区别。
1. 传统数据库VS数据中台
处理的业务不同
传统数据库是操作型业务处理,即会对数据进行增删改查,数仓是分析型业务处理,主要针对数据进行查询。
关注点不同
传统数据库更关注操作时的响应时间、并发量等,数仓关注的是数据分析,主要用来进行商业决策。
存储的数据类型不同
传统数据库存储的是业务数据,而数仓存储的是历史数据。
冗余设计不同
传统数据库在设计时尽量避免冗余,而数仓有意引入冗余以便支撑商业分析。
设计理念不同
传统数据库是为了捕获数据而设计的,即用户的每一个操作为变为数据资产存储在系统中,而数仓是为分析数据而设计的。
总之,数据中台不是不需要传统数据库,而是需要在传统数据库的上层再添加一层数据仓库来衔接数据源系统和分析/展示系统。
2. 为什么不直接在原有基础上直接改造?
在原有架构上改造岂不是成本更低?
原有过程是直读的方式,浏览器直接读取业务库而获取数据,经过大量实践证明,这条路不好走,失败案例多入牛毛,原因如下:
因为安全原因,某些数据无法直接读取
业务系统变更频繁,需要重写分析系统和测试
难以建立和维护来自多个系统的报表、汇总数据
业务系统的很多列是硬编码或是无意义字符串
业务系统的数据格式不统一
业务系统表结构为事务处理而做的性能优化不适用于查询分析
找不到适当方式把有价值数据合并和应用
影响业务系统事务处理性能
所以,从技术角度看,想要快速、精确、低成本的进行数据分析,引入中台是必然的路径。
在企业数字化实践的道路上,随着时间的积累,引入数据中台是挖掘数据、节省成本、快速相应决策分析需求的必经之路。