> 文档中心 > 数据中台到底能治什么“病”?

数据中台到底能治什么“病”?

关注、星标公众号【 数据之美 】,和你一起成长

原文链接:数据中台到底能治什么“病”?


数据中台是一种将企业的数据变成数据资产,通过系统和机制将数据使用起来,产生产业智能,从而为业务服务,实现数据价值变现。我们就来聊一聊数据中台解决的三个重要问题,以及解决方案。

1. 数据质量的困扰

在企业中,数据团队一般包括数据开发、数据工程、数据产品和数据分析等团队。数据质量很重要,它是一切数据建设和数据产品化的基础。数据质量的问题可能会导致开发与产品决策的偏差。

数据质量的问题也中很多业务部门的一个”痛点“。例如,数据报表产出经常延迟。各个部门因为定义不同,指标同名不同义、同义不同名的情况,经常出现数据不一致的情况,这样会让数据的各个使用方感到很困惑,同时也很无奈。

随着业务的发展,企业内数据的数据量会呈现爆炸式的增长,数据能发挥的价值会越来越大,数据质量的问题就会越来越严重。低质量的数据不仅使用不便,还有可能误导决策,导致灾难性的结果。可以说,数据质量的高低决定了数据是否能够真正发挥价值。

有了衡量标准才好确定工作方向,从定性的角度来看,数据质量的衡量涉及以下几个方面:

  1. 数据的完整性

数据完整性包括数据各维度的完整性,例如用户性别、地域、教育程度等方面,如果有缺失的话可能会直接影响到后续服务的程度。

  1. 数据的准确性

数据准确性是指真实值与采集值之间的误差。数据准确性至关重要,只要在数据准确的情况下,基于数据的决策才有可能做到准确、可靠。

  1. 数据的一致性

对于同一个指标,需要保持一致性。不同的数据出口如果数据不一致,数据使用方可能会对数据质量产生怀疑,甚至产生不信任感。

  1. 数据的规范性

数据规范性,需要数据部门按照统一的数据格式、命名规则等有效的组织起来,方便于数据部门对数据进行管理,业务部门便于获取的使用。

  1. 数据的时效性

数据时效性要求数据能够在一定时间内生产出来。例如公司正常上班时间是早上10点,数据的产出应该在这个时间之前产出,不然就可能会影响到业务部门对数据产出的使用。

2. 数据获取的效率

数据获取的效率在很大程度上反应企业数据化的程度,同时会影响到数据部门与业务部门之间的协同工作效率,这样就容易形成恶性循环,数据部门长期被数据需求压得喘不过气来,却在业务部门那里无法发挥其真正的数据价值。

数据部门

极高的数据获取成本,会让数据开发工程师和数据分析师每天都在解决无穷无尽的数据需求,觉得自己没有成长。例如数据分层不能很好的隔离错误数据,需要重复地去原始表中处理数据,既浪费人力,又影响效率;数据分析师每天面对一大堆数据提取需求,觉得自己像个“工具人”,一个只会提数的机器人等等,这样的状态是不可持续的,数据部门必须想出一个解决方案。

业务部门

业务部门提出的数据需求总是延迟交付,数据需求没有按紧急程序进行分类,导致数据延迟产出等。造成这些问题的根本原因是大部分需求都需要依赖人力,而且大量重复性的数据需求,从而导致开发时间长、效率低。

解决方案

数据中台化很重要,这是我们提升数据质量和数据获取效率的基础,同时从产品工具层面来提升数据的获取效率。

首先要实现数据的分层和建模,完成数据中台化,由数据中台开发和提供统一的指标体系和数据服务。例如,建设元数据中心、数据指标中心、数仓模型中心、数据资产中心等,并最终基于完善的数据中台,建立数据服务中心和自助分析平台,规范数据的统一出口,从而提升整体数据服务的交付效率和研发速度。

其次设计和开发自助式数据统计工具,能够让业务方通过数据中台提供的数据配置日常数据报表,而不再依赖研发部门人力,同时提供对业务方友好的明细数据提取功能,真正满足业务方既要快速看到指标数据,又需要查询到明细数据的需求,解放人力的同时,提升大家的工作效率。

3. 数据应用的价值

在解决的之前的数据质量与数据获取问题之后,我们就来谈一谈数据应用的价值。以电商为例,数据应用的价值我们可以使用提升 GMV 来体现。

GMV= 访问用户数 × 转化率 × 客单价

在用户获取环节,首先需要建立一套丰富的用户标签体系,基于用户画像进行精准营销,从而实现访问用户数量的增长。

在搜索环节,提升搜索系统的准确性,让用户尽快搜索到自己想要的商品;在推荐环节,实现个性化推荐,基于用户画像和商品画像,形成人和货的准确匹配,最终实现给用户推荐的商品尽可能多地被用户购买。

在用户下单后环节,数据应用于物流供给与订单需求匹配方面,需要分析某个时间段、某片区域的物流供给与订单需求数据情况,从而进行合理的物流资源的安排。

当用户完成交易离开网站后,通过用户兴趣的匹配,使用推送系统对用户进行留在与回访的维系,提高用户的使用粘性。

写在最后的话

从数据中台的提出到现在已经好几个年头,在阿里等企业的推动下,中台概念已经得到初步的验证。大部分企业不再建设烟囱式系统,更倾向于数据集中采集、存储,并应用分层建设。这种方式一方面有利于应用系统的快速部署,另一方面也保证了数据的集中管理与运营,体现数据的资产、资源属性。本篇概述了数据中台建设中支解决的三个问题,希望对你能有所启发。