用友华表华秀章认为,大数据发展可分为三个阶段。第一阶段,大数据的存储。这一阶段做得已经很好了,Hadoop的HDFS等分布式文件系统很好地解决了大数据的存储问题;第二阶段,大数据的计算。这一阶段将大数据与云计算联系起来,可套用一句歌词形象表达二者关系:“蓝蓝的天上白云飘,白云(云计算)上面大数据跑”。如果只是大数据的存储,不需要云计算。但要让大数据“跑”起来,实现大数据计算,则需要云计算这样超强的、弹性的、廉价的计算能力,毕竟Hadoop的MapReduce动辄几十上百个节点及配套设施的投入,不是一般企业能承受得了的;第三阶段,大数据的价值。这是大数据发展的最高阶段,“大数据大价值”,从大数据中挖掘出企业经营知识,支持企业精准决策。这就是数据挖掘等BI工具的作用,但传统BI工具难以胜任大数据的挖掘、分析工作,需要一些新的技术与手段,需要BI for Big Data。
有人预言,未来数据可能取代石油,成为全球最大的交易商品。面对大数据,企业的看法不一,甚至出现大数据是谎言的说法,认为大数据并没有传说中那么强大。其实大数据的体量大小、价值大小,不可一概而论。用友华表华秀章认为,大数据是否谎言,要看具体对象,如同“小马过河”,说水深水浅需因“人”而异,不加区分一概而论有时就会演变为谎言。对于互联网公司、电商,大数据绝非谎言,大量的用户行为数据,让数据急剧膨胀到PB级。而对传统企业,他们绝大部分还没有到达“企业2.0”,没有企业SNS,没有移动应用,哪来那么多数据?倒来倒去都超不过1TB。对他们谈PB级大数据,就是谎言。
在企业做好迎接大数据的准备时,大数据如何落地成为他们思考的问题。大数据有四个V,容量、类型、价值、速度。由于大数据涵盖的内容很多,业务场景十分丰富,企业落地大数据,要根据业务需求确定实施优先级,不能期望一步到位,因此企业对这四个V的需求重要性也有所不同。