确切地说,Tableau带着乔布斯时代的苹果基因——颜值高、门槛低。
王众/文
把Tableau和苹果拽上联系,丝毫不牵强附会,毕竟,Tableau的首席科学家就是和乔布斯并肩创立皮克斯的PatHanrahan。作为BI界两大成功的搅局者,Qlik和Tableau之间的区别可以追溯到基因区别。
颜值高、门槛低
Hanrahan曾在乔布斯的皮克斯动画工作室负责视觉特效渲染,使得在电脑上绘制漫画成为可能。他还凭借《玩具总动员》和《魔戒》两度获得过奥斯卡最佳科学技术奖。通过这两部大片的画风,就可以想象Tableau出色的视觉风格。
Hanrahan与苹果并无关系,至于Tableau的易用性,则可能缘于它的军方基因——战场的实时分析,当然操作越简单、显示越直观越好。离开皮克斯后,Hanrahan教授回到斯坦福教授计算机图形学,期间和他的一个博士生ChrisStolte受美国军方邀请,研究实现战地可视化,为了尽快绘制出战地数据的逻辑,他们研究了基于表格的多维关系数据展示。
他们把关系型数据库的语法与驱动图像展示的编程脚本整合在一起,开发出了一种全新的可视化关系数据库VizQL,并且提供了一个高度定制的界面,可以从多种角度高效、直观的展示多维数据库的数据结构与逻辑关系。
到了2003年,斯坦福校友、软银合伙人ChristianChabot说服Hanrahan师徒将VizQL商业化,成立了Tableau,这个词语的本意就是造型和美术作品。也就是说,这款产品生来就是为了给数据造型的。
Tableau大中华区销售总监叶松林描绘这个技术时说:“依靠数据科学家解读数据的日子一去不复返了。现在,通过数据可视化软件,一线的业务人员就可以整理、分析他们的数据,并呈现为多种形式,伸直可以直接发给上级、纳入综合报表中。这种自助分析的文化将帮助企业运营得更快捷、更智能。”不独企业,这种自助分析文化也可以应用到个人生活中。
我的朋友Z统计专业毕业后,留在纽约做数据工程师,他所供职的公司是Tableau的大客户,Z当时的应聘材料中就包括了一个Tableau的操作视频,“3分钟制作纽约地产租金分布图”,使用的开源数据是纽约市地产租赁业的公开数据和谷歌地图。我看了这个视频,整个过程与编程、函数无关。
也就是说,屏蔽掉Z本人的身份,一个数据技术的外行也可以便捷的做出这样一张图。他可能是个正在找房的租客,通过这张图定位符合自己预算的区域;也可能是地产从业人员,通过这张图了解全市的业态;也可以是准备招租的房主,通过这张图给自己的房子合理标价。
BI的最后一公里
与Qlik不同,Tableau是一款轻量级产品,扮演的角色是BI的最后一公里。已经建有BI系统的企业可以直接将它集成到已有的系统中,放在最后一步。比如Tableau的中国客户灵北(北京)医药信息咨询有限公司。
该公司的业务运营总监孙云峰看中的,是它能够让BI经理对IT团队的依赖降到最低、也将数据处理的用时降到最低,从而将更多的时间放在数据分析以及与相关业务部门的沟通上。BI是孙云峰优化业务运营的其中一个工具,而这个工具的负责人只有一个,即BI经理。他要有能力解读BI分析结果,并与相关的业务部门或个人充分沟通问题的症结或优化的建议。
最理想的状态是,BI经理既懂行业又是技术大拿,孙云峰说,这将是未来对BI人才的要求。但起码在目前的情况下,假设真有这样完美的BI经理,他再修炼几年就能够成为该细分行业的数据科学家,这个岗位又该另招人了。现阶段的BI经理通常也要两手抓,但分析业务的那只手更硬。
对于BI经理来说,分析时使用的变量越多、维度越多,对问题分析得越透彻、得出的结论越准确。而传统的BI系统,需要先对数据建模、再分析,建模的过程对IT技术要求高,以至于每一次更新都是一次开发的过程,需要仰仗IT团队,周期长、灵活性差。
Tableau几乎抹去了开发周期,只要有结构化数据,BI经理就可以通过拖拽数据项目即时建模、并生成图和表。尤其是图形表达,可以让结果呈现得更加直观。举个简单的例子,要分析多种药品在限定时间段内、在全国各地的销售情况,可以直接将销售量显示在地图上,每种药品用不同颜色的气泡表示,销售量的大小则用气泡的大小表示,这样一张图就可以指导各地的配货。
更重要的是,便捷性可以让BI分析成为探索过程,时间和技术成本的急剧降低,允许BI经理探索多维数据间的关系,从而发现更多的业务秘密。
但这里需要注意的是,Tableau处理的是结构化数据,如果是丝毫未经整理的数据源,恕不接待。
Z所在的公司是一家视频网站,其数据分析是真正的实时大数据分析,每一帧视频的数据及网站上同时发生的所有数据信息都不放过,这样才能精准地分析出网站用户的行为规律,并据此给出最精准的广告投放方案。
这就需要先通过Hadoop提取出数据、再由数据工程师将其结构化,数据工程师们可以使用这些数据监测错漏、实时修复;数据的使用者们才能借助Tableau分析这些实时海量数据,迅速做出业务决策。面对互联网企业吞吐的、如此多维的元数据,根本无从建模,所谓的分析过程就是探索过程。
再往后看几年,到了物联网时代,数据将更加海量和复杂。叶松林分析;“交互性、可研究性和共享性是使物联网数据有用而无需庞大数据项目的关键。理想情况下,用户将能够与他们的数据和其他数据探索进行随意且深入的对话,使他们能够发现各种排列,甚至有时发现他们未知的存在着的模式。”到时,易用的探索型BI工具则会成为必需品。