经营分析系统的三生三世(三)

不仅省公司有,在总部也具备进行海量数据分析的条件,所以当时有集团公司领导称,经营分析系统是中国移动面向未来的核心竞争力。

早在十几年前,中国移动就着手建设了以数据仓库技术为核心的经营分析系统。这几年大数据的话题非常火爆,业界也非常关注运营商在大数据领域的探索和实践。今年5.17"世界电信与信息社会日"的主题确定为"发展大数据,扩大影响力(Big Data for Big Impact)",所以启动一个新的连载,说说我对这方面的理解。

在2001年的经营分析系统规范里特别强调,规范适用于指导省级经营分析系统的建设。而此后,中国移动创造性地提出一级经营分析系统的建设方案,最终与二级省级经营分析系统组成了"两级体系"。今天就来说说这个全球独一无二的两级数据仓库体系的中央节点:一级经营分析系统。

第三部分:一级经营分析系统

【一级经营分析系统的需求分析】

为了指导和驱动省级经营分析系统建设,在写规范的时候,总部牵头整理出了"九大主题",基本把多维分析的需求都列了出来。

然而,总部对数据仓库系统的需求,却和省公司对数据分析的要求大不同。

首先,总部非常需要企业的经营汇总数据。

比如,每天中午左右,中国移动总部就能收集齐全部省公司前一天的经营数据,汇总之后,通过彩信或者其他方式告知相关领导和业务、财务等部门,其中包括新增用户数、发生的业务量、重点指标的变化等,甚至可以根据不同的分管和兴趣,进行个性化定制。

通过信息化手段掌控前一天的全国经营情况,这个能力中国移动在2003年前后就已经具备了。传说,晓初总去了中国电信之后,对两家公司在信息化的差距深有感触:在移动他可以接收到前一天的经营数据;而在中国电信,这个信息可能滞后一个月,准确性还不高。

在中国移动的两级体系中,省公司是经营主体,经常需要对运营状况做出准确地判断、及时地决策,很多移动省公司领导都会每天看数据,根据情况进行策略调整甚至组织人员的变更。

而总部更多看的是整体趋势,不需要像省公司那样迅速做出应对。所以对于管理机构来说,虽然第一次看到这么多信息时,往往会非常惊喜,认为这种数据收集和展示的能力非常重要;但这些数据的日变化量不大,如果没有对数据的敏感和使用需求,时间久了就会对这些数据和信息麻木。

从实际运营情况来看,这些汇总数据主要用于管理和分析,未必对数据的及时性有特别要求。

这里要特别强调的是:数据的及时性不重要,但数据展示的及时性非常重要。

对于总部来说,能给别人秀这种数据收集能力,甚至比数据本身产生的价值要高。

我就曾经对开发团队提过这样的要求:每日经营数据的更新彩信必须及时送达,甚至可以为了确保及时性牺牲准确性。如果某个省公司的数据发生延迟或者有明显错误,就用这个省前一天的数据。

总部另一个不同于省公司的重要需求,就是数据校验。

从基层传递上来的数据是否准确,这是让所有管理机构都很头疼的问题,如果报上来的数据有假,那么决策的准确性可想而知。

通常的解决方案就是数据直接采集,让下级单位无法干预、不能造假。

问题在于,再建一套数据直达总部的系统成本太高,两级体系之下数据的主要使用部门是省移动公司,总部拿到的数据未必能产生大的商业价值,建一套直接采集数据的一级数据仓库系统,经济效益会比较差。

实际上,由于总部的系统每天都有数据更新,已经加大了下级单位的造假难度。而且,由于总部已经采集了足够多的数据,将数据与其他单位的数据进行横向的交叉验证、与历史情况进行纵向的交叉验证,以及将汇总信息与抽样信息之间进行交叉验证,就成为总部提高信息真实性的有效手段。

尤其在系统建设初期,总部的数据和应用使用部门需求并不多,应用服务器比较空的时候去做数据交叉验证,岂不是正好!

第三类需求,是在部分场景下,总部要像省公司一样去做分析,比如进行某全网产品的设计、或者对某省公司重点帮扶,或者为某件具体分析应用需要使用全网数据。

这些场景是最常规的经营分析应用,也是系统必须要支持和考虑的需求内容。

【一级经营分析系统的建设方案】

在中国移动之前,全球的数据仓库系统都是集中统一的。

道理很简单:数据规模越大,数据仓库的价值越高。

然而,有两方面的原因,致使中国移动无法建立全国集中的数据仓库。

其一,是技术手段和成本的制约。

在本世纪初,TB级已经是非常庞大的数据仓库了。如果要构建全国集中的数据仓库,就要把中国移动分布在全国的数亿客户的客户资料、账单、详细话单、终端信息等数据全部抽取到总部,成本相当地高;而构建如此庞大的数据仓库系统,技术方面也没有哪家公司有足够的把握。

说到这里,想起一段真事:当年某数据仓库厂商技术人员和我们交流,我们屡屡质疑其数据库的最大规模,对方生气了,对我们说:"你们总在质疑我们是否支持得了TB级数据,我们其实一直怀疑你们有没有TB规模的数据!"我们当时就笑场了,得出的结论是:这家公司缺乏电信行业经验。

其二,是应用方面的特殊性。

经营分析系统初建时,省公司是真正的经营主体,虽然在数据分析方面的使用并不多,但和总部相比,需求和想法还是会多很多。

当时,总部的工作是以管理和协调为主,对于数据在精确度和及时性方面的要求并不高,大多数情况下系统能提供静态报表就够了,只有少部分场景需要和省公司类似的经营分析能力,因此不能照搬省公司的系统建设方案。

说得再直白一些,就是中国移动总部的经营分析系统技术方案,不能按照常规的电信运营商的数据仓库系统来建。

针对中国移动总部的实际需求,综合技术、应用、成本等方面的考虑,最终一级经营分析系统的建设方案中,对不同类型的数据,采取了不同的采集和存储策略。

首先,对于管理应用所必须的汇总数据,是全量采集,全量存储。

这主要是指九大分析主题中已经规范化的汇总信息,涵盖了企业经营管理所需要的业务财务基本信息。

由于当时业务支撑系统主要负责业务支撑,所以对于财务数据,尤其是支出方面的数据,虽然提了技术要求,但对实际执行情况并未寄予过高期望。

其次,对于部分高价值、低获取成本的基础数据,是全量采集、全量存储。包括客户的基础信息、每月的账单情况,以及重点业务的详细情况等。

可能会有读者质疑,难道在总部收集了所有客户的基本信息么?答案是:是的。

其实,一个客户的基础信息量并不大,把中国移动数亿客户的基本信息放在一起,也占不了多少存储空间,但这些信息潜在的商业价值非常大。

第三,对于数据量非常大的细节数据,比如用户的通话详单,既然省公司已经保存了全量数据,总部就没必要再存一份。

当然,有些场景还是会需要这些细节数据,而且还需要细节数据用于对汇总数据真实性的校验,因此,最终采用抽样的方式,选取一定比例(比如1%的用户)从省级经营分析系统获取这类细节数据。

除了确定一级经营分析系统的技术和建设方案,还需要制定具体的接口标准和管控要求,用来打通两级经营分析系统。

这是一项琐碎复杂的基础性工作,不仅要考虑到技术方面的因素,还要考虑到全网统一执行的可行性,以及配套的管理措施。

【结语】

许多做分析算法的人,都经常感慨"巧妇难为无米之炊",指的就是有应用计算的能力,却没有数据基础。

而在十多年前,在大数据的概念还没有形成和兴起的时候,中国移动就已经拥有数亿客户的全量信息,包括性别、年龄、地址等基本属性,以及消费能力、活跃度、终端信息等扩展属性,并能将客户信息和他的业务使用情况、终端更新信息、运动行为轨迹等数据进行关联。

不仅省公司有,在总部也具备进行海量数据分析的条件,所以当时有集团公司领导称,经营分析系统是中国移动面向未来的核心竞争力。

在两级体系中,省级经营分析系统是两级数据仓库体系的重点,为市场一线和省公司的运营管理做好支撑。

但是,总部作为管理机构,即使有了很多数据,也可能会根据临时性需求或者管理性要求,提出需要省级经营分析系统配合的内容,并且会根据业务发展情况对两级经营分析系统进行调整。

如果这方面的节奏和工作重点控制不好,就会导致省公司系统的系统资源过多地被总部的需求所消耗,从全网角度看,得不偿失。

两级经分体系对应的运营体系,是集团公司管理之下的各地自行开展属地化经营。而在互联网时代,由于更加先进的"大数据"的飞速发展,传统的两级数据仓库体系该如何进一步演进,发挥全网一体化的优势?

这个话题,我在这个系列的最后一篇,也就是517那天再细说,如何通过集中化运营进一步发掘和提升数据价值。

广告等商务合作,请点击这里

本文为转载内容,授权事宜请联系原著作权人。

打开界面新闻APP,查看原文
界面新闻
打开界面新闻,查看更多专业报道

热门评论

打开APP,查看全部评论,抢神评席位

热门推荐

    下载界面APP 订阅更多品牌栏目
      界面新闻
      界面新闻
      只服务于独立思考的人群
      打开