视频及PPT的下载地址:请点击这里下载>>
首先非常感谢畅享IT提供了一个跟大家分享的平台,我也是第一次受邀参加畅享IT的活动,以前更多地是在一些行业的会议上做过一些演讲,跟客户面对面的咨询和交流比较多。利用互联网跟大家做演讲还是第一次,比较激动,那现在开始今天的演讲。
今天跟大家交流的主题是:跨越鸿沟,大数据从技术到商业价值,分享的内容是:大数据发展的趋势,接下来会讲大数据现在已经非常成熟了,为什么在企业来讲应用案例并不是太多,这就说明有一个鸿沟的存在,那么这个鸿沟存在的原因是什么,我们要怎样跨越这个鸿沟,那接下来我会根据我负责的这个产品研发的初衷、过程以及案例,通过这个产品的介绍能够给大家在大数据创新、应用这方面给大家带来启发和思考。那第一部分我们先看一下大数据发展的趋势,那这里有一些知名的机构,像Gartner、IDC的报告,从报告来看,大数据市场从2014年到2017年整个的市场空间都是几百亿美元,像这种增长的速度都是20%-30%,所以说大数据的发展空间和趋势这个问题是不用再去质疑的,那我们看看从技术的角度看,它现在是在哪个阶段,从图中我们可以看到大数据现在是在右侧,不在峰顶的位置,在峰顶位置上的是互联网,再倒退2年的话,那个时候应该是在概念炒作的顶峰,从这张图可以看到big data到了落地的阶段,接下来我们再看下从12年到14年大数据落地时的阶段是怎样的一个情况,从12年开始已经有部分的企业做大数据相关的工作,2年前的话,大概有1/3的企业在考虑我要开展或引入大数据相关的项目,我个人来说的话是在09年年末的时候开始做大数据方面的工作,过程中我和客户的接触比较多,可以和大家举一个非常极端的例子,就是在我们接触到的客户里面其中有一所山东的大学,它就要建一个校园网,类似于人人网、facebook这样的一个校园社区,其实他完全没有必要上大数据,但是实际情况他采购了这个方案,那我们就跟他说你也没有那么多的数据量啊,为什么要采购这个项目,他就说学校里面如果说IT部门要是做一个项目的话,也是要向我们大多数企业一样有一个立项审批的这样一个过程,负责人就跟我们说如果在立项的时候跟我们这个大数据不沾边,这个项目就很难被批下来。我想通过这个例子来说一下,现在是14年也年底了,企业要把大数据落地心情呢都是特别迫切的。前面是说大数据发展的趋势和落地的情况,通过我前面的介绍大家也能发现大数据在落地的过程中是存在一些问题的,接下来我们就看为什么会存在这些问题,大数据现在来说,虽然过了炒作的顶峰,对于大部分人来说大数据的概念和相关的技术也了解一些,那到底是怎么样落地、应用还是有一个巨大的问题的。就是引入大数据鸿沟这样一个概念,先看一下是因为哪些问题造成大数据落地困难、大数据鸿沟的出现。因为我跟各行各业的客户都有过交流,包括家电企业、航空、电信、金融、能源、政府等等都有接触,大家咨询我咨询最多的问题就集中在3个方面,第一就是企业的数据量小,对于一般的传统企业来讲可能的确没有太多的数据量,想金融行业,一般的银行数据小的是有100多,大的甚至有几百个系统,这种的话可能会有大的数据,但是传统的像制造业企业、化工企业数据量就很小,这个时候如果说我想运用大数据的技术,帮助我的企业业务上有增长这个时候我该怎么办,第二个问题是大数据和传统BI有什么区别?商务智能可以说是无所不包、无所不能这样一个词,之前一个银行的客户就出现了一个问题就是在技术路线的选择上,我到底是用大数据还是BI,同样的问题我用BI的技术手段也能解决,用大数据也能解决,那么我用大数据在承载上能给我带来什么好处,从技术的扩展性上、商业回报上能带来什么好处,这也是大家非常关心的一个问题,第三个是最严重的一个问题,就是大家都想做大数据,但是往往就是因为缺乏这个大数据的规划能力,像我们接触到的一个券商,到美国考察的时候,回来就说我们一定要上大数据,但是项目的业务指标就发放到业务部门,但是业务部门想不清楚这个事情就是用大数据到底来做什么?这个大数据最大的一个问题就是缺乏大数据业务规划能力。因为不像其他的一些项目是可以借鉴前人的一些经验,现在对于大数据来说真正有价值的案例还是非常少的,所以说完全就是要自己去规划。综上原因就是现在大数据炒的火热但是在落地的时候是非常困难的,那么现在目前来说我们看到这个鸿沟就是这些,接下来我会介绍下针对这些原因,怎么样来应对。那么第一个说一下企业数据量小的这个问题,谈到这个问题一定要先说一下我们理解的大数据的组成有哪些?对于传统的企业来说我们认为这个数据就是我们企业的内部系统所产生的数据,比如说ERP、CRM系统其他的业务支撑系统像订单管理、销售渠道管理产生的这些数据,那么这些数据肯定是大数据的一个重要的组成部分,但是现在从整个大数据的案例来看除了企业内部的数据以为,更多的是企业外部的数据,占到80%,又可以分成2部分,第一种是行为类型的或者说日志类型的数据,比如说用户在用移动终端、或者是网页浏览点击流的行为,对于大数据来说这种行为类型的数据是很重要的,第二种是第三方的数据,行业类型数据,比如说我是金融行业,就要关注一些主流的财经类型的网站上面的咨询和信息,比如说我是航空的就要关注携程、去哪儿上面航班票价的信息,像社交媒体就要关注微博、facebook等这上面的数据。所以说企业数据量的多与广绝对不是你能不能做大数据相关项目的问题,我们一定要把数据的范围进行扩展和延伸,不要仅仅盯着企业内部有多少数据,我们还要看到用户跟用户交互的数据,用户行为数据还要充分的运用第三方的数据,比如说社交媒体、行业网站上的数据。给大家举个例子就是有一个汽车厂商,数据量也不是很大,属于制造行业,为了提高汽车的销量,我们去58同城、赶集网、百姓网这些信息网站帮他查询车主要卖车的这种信息,有手机号码,比如说我姓刘,所在地是大连,发布了一个卖车的信息,我们这个系统马上就会把我的信息发送到大连城市4S店的销售手里,就会说我看到您在58同城上发布了一个卖车的信息,您有没有兴趣考虑下我们公司的什么什么牌子的车,这个系统就能帮助他提高发现销售机会的效率,刚才提到了20%是企业内部的数据,80%是企业外部的数据,对于企业外部的数据大部分都是非结构话类型的数据,对数据类型的分类大部分应该是3种,我在这里面分为4种,除了结构化、非结构化、半结构化还有准结构化数据,比如说微博上的信息,就是一条准结构化数据,所以说对于我们来说有数据量小这种想法和疑问的时候,往往只关注了企业内部的数据,还有很多的非结构化类型的数据也是需要关注的。接下来回答第二个问题,大数据是否等同于BI,先从技术的维度来看一个,区别的话,我想各位都比较熟悉,我是想强调一点,大数据的成本更低,不是用昂贵的硬件而是用软件,大多数用的是开源软件,这是从成本上来说,第二大区别是大数据更多的是分布式处理,这种架构可以保证效率,再一个就是大数据可以应对更多地数据量,对于传统BI来说大概到TB级别就差不多了,成本是很吓人的,这是技术上的区别,下面我们看在应用场景上的区别,传统BI更多地是在过去的阶段性数据一种汇总和总结,看到的基本上是报表,起到的作用是决策辅助,可以利用传统报表来判断、分析事情的危险等级和发展趋势。大数据的应用场景更多地是直接形成决策,这是跟传统BI很大的区别。举个例子就是推荐系统,大家都很熟悉,上淘宝、京东界面上都有推荐,那么它是怎么形成的呢?数据采集、处理到最后整个过程没有人工的参与,就是直接把最后的结果推送到客户面前,所以说它不在是辅助的作用而是直接把结果呈现在用户面前,通过这个例子就可以看出传统BI和大数据在应用场景上的区别接下来我们再看下第三个问题,就是说缺乏大数据业务上的规划能力,那么我们要想解决这个问题,首先要对自身所在的企业要有清晰的认识,按照大数据的创新类型来分,我们可以把它划分为3类,数据拥有着,无疑是最幸福的、市值最高的企业,比如说:酷狗、阿里巴巴;第二种是拥有数据处理相关基础的企业,比如说,Oracle、TD、东软这种类型的企业,第三种类型是有数据创新类型的企业,如Datashift,它花了2亿美元把全亮数据进行分类、处理、加工,比如说你是金融行业,就把金融行业的数据提取出来分类加工,就相当于做了一个分类数据的批发商,所以说我们要了解创新类型,结合自身企业判断属于哪一种类型,如何来去作大数据方面的业务规划。当我们了解了自身的定位以后,就要考虑如何导入大数据,分过程阶段,在我们起步的时候,最容易做的事情就是回答现有业务中的已知问题,举个例子我们以前出一个报表时需要15分钟的时间来完成,引入大数据的技术后,会20秒或30秒就可以出来,这是显而易见的,也是风险最小的,所以说初期尝试大数据的话,可以从现有业务中已知的问题来做,专注于提高业绩和运营效率。下面的就是主要专注于创新的方面,如果说我们要规划大数据要进行创新型的业务,那么我们应该怎么样来做,关注那几个方面,从战略上来说分3种,第一种是客户战略,以前做企业是希望买完产品永远别来找我,现在思路不一样了,现在是希望跟客户保持连接,希望客户买完产品后,想了解一天能用多少次,每次用多长时间,使用中有什么问题,我们希望能提高客户的忠诚度,能二次购买,能传播我们的产品。在这种创新的战略里面见效最快的无疑是客户这一块,就是如何通过大数据使客户量变大,发现更多的客户,对已有的客户发掘出新的购买潜力,这是最易着手的并且见效最快的,再下一步就是产品战略,怎样借用大数据的技术开发出更好的产品,满足与市场需要,消费者会喜欢的这种产品,第三个阶段是在生态系统战略这方面是需要一个很高的企业才可以去考虑的,企业可以从生态系统中的其他企业处获得补充数据,这种生态系统以适当的合作战略为基础。我们刚才回答了3个问题,通过问题我们说了如何通过大数据来跨越大数据鸿沟。
那今天我要跟大家交流的问题大概也就介绍完了,谢谢大家!