视频及PPT的下载地址:请点击这里下载>>
大家好,非常感谢畅享IT跟大家一起做大数据的讲座这场活动,其实大数据这块这些年非常热,我个人认为很多企业都想上大数据,我觉得从大数据上来讲它更是一种思维方式,不用把大数据想的太复杂,它在日常就是存在着的,我举个前几天发生的例子,前两天我跟几个同事在上海打出租车,我们四个人中午站在马路边上,很多司机看了我们一下都不停,当时我们觉得很诧异,我们四个人长的都不是坏人那为什么司机都不停呢?后来好不容易打到辆车,我们就跟出租车司机聊这个事情,出租车司机都说,你看你们四个人,实际上这个就涉及到大数据的一个维度就是四个人的维度,另外一个是大中午,他说你们四个人大中午的来打车,肯定是在市区要么吃个饭,要么开个会,这条路又堵所以他就不想带,这里面实际上大数据的核心是一种决策的过程,它是通过多个维度来进行决策,实际上这个司机已经考虑到了几个维度。平常有人说大数据和我们传统的这个报表有什么区别,实际上我们报表基本上是二维的,就是说你的生产产值是多少、比例是多少,是二维来看这个报表。大数据实际上是一种多维的思考方式。刚才那个例子其实已经讲了好几个维度,一个是时间维度、一个是人数维度,而且我认为这次分享的题目是:企业大数据实战经验分享,其实大数据并没有什么高深的东西,它都是存在于我们生活之中,我觉得并不是一种技术,更多的是一种思维方式,不光企业里有,包括出租车司机也有,后来司机跟我们讲:如果说你们把维度从中午改成晚上,那么我一看到你们四个人就很愿意拉,实际上意思是,如果晚上的话大家喝完酒出去4个人、1笔生意就等于4笔生意了,其实大数据的核心如我这边所说,一个是要多维分析,另一个是要有决策。并不是我们企业弄一堆表。这个例子也是我们讲大数据一个精髓的地方,不管用什么手段,能给企业带来生意、给领导提供决策这才是做大数据有用的地方。现在世界杯已经过去了,实际上通过大数据大家也知道这次德国队的冠军,这里面也涉及到了传统的报表和大数据区别的问题,从2014世界杯预选赛开始,德国队就开始使用SAP足球解决方案(SAP Match Insights)进行数据分析,该方案在SAP HANA内存数据库平台上运行,记录球员的跑动路线和传球路线。通过对这些数据的深度分析,教练能了解到球员的状态如何,以及怎样对训练内容作出调整,提高训练质量并制定高效的训练计划,为训练、备战和比赛情况的分析工作提供便利。在巴西世界杯期间,德国队在每场比赛结束后都会用SAP Match Insights进行赛后分析,为下一场比赛做好充分的准备。听足球解说,基本上不是我们说的报表,传统报表主队控球是多少,时间是多少,这些东西是传统的报表是一个二维模式,通过大数据多维模式的分析,它把动态的采集每个球员的点做一个适时决策,实际上通过多维分析更能快速决策另外德国队确实没有那么多球星,通过这些新的手段拿到世界杯。下面我再来讲一个例子,大数据的核心是为决策提供数据支撑,做建模,如果说你建模建的不好的话很难得出你要的结果。在德国队和阿根廷比赛前几个小时,我发现德国队的支持率在上升,而阿根廷的支持率在下降,那么大家想一想如果说按照这种情况,应该支持德国队的人多,支持阿根廷的人会比较少,那么当时出现很奇怪的一个现象,按理说你支持的球队的人增多的话那么它的赔率应该是下降的,但是当时买德国队的人多反而赔率上升了,如果说普通的建模的话这个东西肯定预测不出来了,不符合现有的情况。实际上这里面涉及到如何建模的一个问题,如果说你一个人给一个票这样建模的话,肯定是不行的,而且你决策出来的结果肯定是错的,那么这应该要怎么建模呢?实际上对人的话要增加一个属性,大家如果做股票的话,就知道股票里面有散户和主力,散户的资金可能比较少,主力的资金比较大,一个散户的资金占有额和一个主力的资金占有额肯定是不一样的,博弈公司是根据总的资金数来做这个平衡的,那么支持德国队的人越多赔率为什么越大呢?其实这就说明一个问题支持德国队的人都是散户,他的资金量不是很大,虽然支持阿根廷的人数比较少,但是平均资金额多,就这种情况我当时就做了一个大胆的预测,球市如股市,总是往散户最难受的额方向运行,50分钟打平的概率大,赌德国赢得输一半,后来也证实了我的预测是对的。如果你建模的时候只考虑到一个人,没办法得到决策的,但是如果说你在建模的时候考虑到散户和主力,会对你的决策有帮助。
大数据很多东西跟我们传统的方式是不同的,大数据其实就是一种概率,并不是完全准确的东西,这也是很多人做大数据的时候一开始不习惯的地方,包括给用户做的时候,也经常讲,如果有2个算法,一个算法的准确率是93%,一个是90%,如果说90%的算法能讲出点道理来,客户反而愿意用90%的算法,这是因为受我们传统思维模式的限制。以前有人讽刺大数据讲过一个例子,一个小孩在长,一棵树也在长,他们觉得通过小孩长预测树长是一个很奇怪的事情,其实通过大数据来讲这只是一种预测,能通过小孩的长来预测树长就好了,不要想其他的东西。很多公司再做工业4.0,核心其实是战略在这边的。就是我的产品做好了就不怕卖不出去,以前的这种生产模式是以产品的设计、销售为中心,对于现在来讲,产品依旧是重要的。产品也是核心竞争力的地方,现在人的需求多样化以后,其实现在基本上需要产品,还需要符合客户个性化的要求,如果不通过大数据是很难做的,因为你的产品质量控制好,设计符合市场的需求就好了,如果你已客户为中心,你用传统的软件很难达到客户个性化的要求,这里面就涉及到做大数据的规划和工作。很多企业要看你是不是以产品为中心向客户为中心的战略规划,对不同的客户提供不同的服务不同的价格,最终能使得企业收益最大化,对于企业来讲都要思考是不是需要以产品为中心向客户为中心的战略转型,如果你不需要的话,大数据对企业就不是那么重要。战略规划:以产品为中心向客户为中心的战略规划;客户价值:通过客户数据模型挖掘客户价值,按照客户等级(价值贡献)配置资源,提高投入产出比,精准营销,洞察新的机会;协同商务:和经销商和代理商的协同商务,库存查询,销售预测;风险管控:通过数据异动模型对客户行为、人员行为进行监控,及时发现风险异动并关闭风险。其实大部分产品在供应链上都处于竞争的状态,通过大数据给经销商做一些预测降低成本,提升效率。根据各种维度来做演算,帮助经销商或门店做这方面得预测,这样就会更精准的减少它的浪费给企业带来效益,实际上通过大数据可以给集团作一些事情,更可以建一个统一的平台给你的经销商或门店作一些事情,因为对于普通的门店它没有管理的能力,如果你建一个大数据平台,把这些服务延伸出去,每个门店能节省几十块钱,这样对于门店的收益也是非常可观的,通过这些新的手段,给经销商、代理商带来收益,整个供应链也会更加健康。通过大数据可以对企业的员工、客户进行监控、分析。一个企业资源是有限的,不可能是把所有客户都伺候好了因为有以产品为中心向客户为中心的战略规划,各种个性化的需求都要满足与他,如果让一个企业满足所有的客户的话可能比较麻烦,我们可以对客户进行分群,通过二八原则,找到高价值客户、低价值客户,对应的高价值客户可以提供更好更高价值服务把他留住,因为20%的客户能为企业带来80%的价值,通过客户价值模型的分析,可以把企业最优的资源用到最高价值客户上面去,这样就能给企业带来更大的收益和更强的核心竞争力,包括作一些精准营销,新的机会是可以的。大数据改变了现有客户生命周期模式,传统的生命周期是从感知、获取、巩固、成熟、衰退到离开一个生命的曲线,基本上大部分的企业都面临这个问题,通过大数据实际上提供了一种新的状态,可以理解为每个周期都是数据采集的一个过程,通过数据不断采集不断演算形成一个环节,在大数据模式下,我们认为它是包括5部分感知、获取、巩固、成熟、新知。拿一个汽车的4s店做例子的话,本来你买完车以后做一个交易就完成了,其实是新的交易和信息获取以后又有了新的商机的开始包括下面的维修、维护、融资租赁、买保险这些。其实大数据是在跟客户的每一个接触点作为数据收集的过程,通过不断收集做预测,再推送新的产品和服务,通过这种数据的采集就形成了客户、服务、产品的一个铁三角这三个也是大数据的核心模型,从而可以做精准营销、智能服务、量化决策。统一数据平台(大数据平台)建设遇到的问题:如何采用统一的主数据管理体系?(标准问题)如何在不影响现有经销商体系下实现电子商务? (理想和现实的问题)如何智能整合各个系统的数据? (数据整合的问题)其实我们看过传统BI效果,大概1/2的时间在整合数据,最后草草的出几张报表,对领导层的决策分析意义多少很难说。UDM是Universal Data_master的缩写,构建的是一种统一、完美模型,数据越多、模型越清晰,解决集团管控和成员公司个性化需求的要求,这里面解决了企业标准化的一个问题。比如说你财务数据里面和HR里面的数据可能不一样,UDM技术可以通过History, recent, source 规则源源不断的进入到我们的统一模型里面,好处就是打破了传统数据库的限制。客户统一ID及360度视图,客户统一ID和传统会员差别在于传统会员也可以合并很多数据,通过绑定微信号、手机号、邮箱等等客户主动提供的方式,而客户统一ID是通过交易形成的客户记录,再把信息串起来的一种模式。举个简单的例子,我们去坐飞机有可能拿着护照、有可能拿着身份证登机通过大数据建模可以识别为同一个人来解决这个问题,原理就是通过不同的维度来识别是否为同一个人。基于大数据的智能电子商务平台,刚才讲了一个是通过销售记录,传统的是根据会员来做,而基于大数据的智能电子商务平台来源于销售记录把它合并起来形成一个统一的UDM的数据模型,在这里面我们可以做统一的客户ID,另外我们刚才讲了可以通过不同的信息来统一数据,核心的话我们做了一个核心价值模型,区分高价值客户与低价值客户,做客户分群。另外是做客户行为分析,他以前买了什么东西,所有这些形成了标签云,做精准营销,最后我们是实现了智能销售、智能服务。高价值、商业客户:服务优先,普通客户:价格优先。数据智能整合数据流程图(第一代),传统的数据仓库肯定要做ODS存储,在这个基础上做数据仓库,EIM实际上是ODS的一个扩展,通过多主键管理,可以多次匹配不同的主键,如证件号码、电话号码、E-mail地址等,智能匹配并形成客户的统一ID,在此基础上建立分析评估平台。数据智能整合数据流程图(第二代)是用SAP HANA来做,HANA是内存数据库,用新一代的效率要提高3-5倍,而且可以把更多的精力放在算发和模型。数据模型建立客户洞察,用户行为趋势统计分析,客户分群,基于客户分群的数据统计,活动、营销事件有效性分析,按照目标客户分群、会员级别、地区等维度分析活动及营销事件对其的影响和响应情况,基于响应率的促销成本估算,市场活动投资回报分析、经销商及合作伙伴绩效分析、经销商及合作伙伴盈利性分析、经销商及合作伙伴覆盖面分析、最佳服务及产品排名。模型验证要去除异常点的数据,这些会影响模型演算的精准率。比如说每年都有春运,如果你建模的时候没有把春运的模型建进去,可能会有问题。内部银行及客户信用量化评估体系,例如一发货就算为销售业绩,其实就没有考虑到发货后对资金占用对企业的影响,可以建立一个内部银行及客户信用量化评估体系,客户提前给了款就算为存款,只要发货没给钱就算利息,可以量化的分析这个客户到底给企业创造了多少价值。呼叫中心的提升:我们对服务体系建立主数据模型,按照每个服务体系的服务规则进行智能适配,减少人工判断的工作量。同时,建立用户主数据模型,同时对服务业务核心数据进行关联和管理,加强业务间的关联,减少数据冗余,减少人力成本。任何一通呼叫将被完整保留作为分析的基准数据。可以有效的提高数据真实及完整性,提升接待成交率。之前传统的呼叫中心业务量比较大,通过现在基于大数据的呼叫中心的模式完全不同,举个例子,之前新疆局势不是很好,包裹到新疆到不了,传统的呼叫中心会发个通知通告,几月几号到新疆的包裹可能会有延误,呼叫中心的话务员就记录了这个东西,万一有包裹寄来就会告诉他这个事情,那么我们新的现在基于大数据的呼叫中心会把他们设为规则,变成知识库,只要有人的包裹去新疆,后台会智能匹配,会提示,实现了智能服务。这是客户生命周期的管理,基于大数据的话,也就是我说的结束也就是一个开始,我们要把客户的每个信息变成客户收集的过程,不断推送新的数据和服务。对于生命周期的演算在很多领域有很大的意义。比如说传统的你卖辆车其实是不挣钱的,有些人都是靠汽车售后服务来挣钱的,但是如何来判断是高价值客户还是低价值客户呢?我们通过这种方式先把高价值客户拉出来,通过决策数给他建模,建模以后可以形成很多的分叉,只要问他年龄多少岁以上、多少岁以下、性别等等问几个问题就能看出他是高价值客户还是低价值的客户,这样就能对决策做出分析。基于大数据的精准营销,就是之前你可以输入一些维度,可以推荐不同的车型,一方面可以推荐不同的产品,另外一方面可以知道她是高价值客户还是低价值客户来做适时决策,提供智能服务。举个例子,比如我匹配到这个人明天要坐飞机,目的地是北京,这时候可以通过规则发送短信北京的天气是什么样?所以说智能服务的核心是统一数据模型,第二是大数据的属性,最后是通过规则形成服务。多维量化分析核心的点是在把各种维度融合在一起来算的。“系统是短暂的 数据是永恒的”这是我在美国读书的时候老师给我的一段话,系统是各种各样的,数据才是最核心的。我就讲到这边,谢谢大家!