“数据科学家”这个BI核心人才根本就是个古董职业,最近它在创新解决方案——数据可视化——的帮助下走下了神坛。
王众/文
今年可能会有大批企业在BI部门新拨一笔钱,因为企业们重要的参考指标GartnerMagicQuadrantforBusinessIntelligenceandAnalyticsPlatforms2016(商业智能和分析平台2016魔力象限)出现了大变脸,原本热闹的领导力象限只剩下3个品牌,其中Qlik和Tableau都是BI的搅局分子;只有微软这个经典品牌留了下来,至于之前一直强势的SAP、IBM、SAS、MicroStrategy等均降到了有远见者象限,Oracle干脆出局。
在这源于市场对BI的需求已经有了根本性的转变,简言之,是由IT主导的企业报表转向了业务主导的自助分析;BI的应用从管理层向业务层、个人层面普及。稍微深究一下,当然是大数据煽的火。
从桌餐到农家乐
商业智能的定义是由HowardDresner在1989年的通俗化而被人们广泛了解。当时将商业智能定义为一类由数据仓库(或数据集市)、查询报表、数据分析、数据挖掘、数据备份和恢复等部分组成的、以帮助企业决策为目的的技术及应用。
提到数据分析,一定要提美国,不仅是因为Gartner魔力象限上的公司的总部几乎都在美国,实在是作为《老友记》铁粉的我深深记得,在这部20多年前的肥皂剧里,Chandler的工作就是数据分析及重构;Joey去参加猜词节目,搭档的职业就是数据科学家。从这个角度看,“数据科学家”这个BI核心人才根本就是个古董职业,虽然它近几年才随着大数据和云计算在我国为大众所知。
这个古董职业最近焕发了新的生机,它在创新解决方案——数据可视化——的帮助下走下了神坛。这种方案的魔力就在于无限降低技术门槛,让普通人能够通过拖拽的方式“分析”数据,还能生成漂亮的报告。
比较起来,传统BI就像一桌套菜,把行业内多年的经验整合和展示出来,帮助企业做出明智的业务经营决策,通常企业在部署BI的时候会选择一个大品牌的整体解决方案。新型BI在推广的概念是自助,但如果从整体架构和长期使用来看,与其说是自助餐,更像是农家乐——你可以直接购买现成的软硬件,也可以自主开发、轻松集成。
知易行难的互联网+
物理网、大数据、新型BI,看上去大数据应用就要帮助企业创新、营收了,实则不然,尤其对于互联网+过程中的传统企业来说。
所谓大数据,并不只是数量大就够了,一个企业在传统BI系统中累积下来的几个数据库,不能叫做大数据,只是历史数据,分析它们是对数据降维,描述过去,解释现状。大数据除了海量,更重要的是来源广泛,尤其是来自网上的非结构性数据,新型BI就是要对付它们,对当下的数据升维,影响现在,改变未来。后者是传统企业最大的挑战,因为它们根本没有外
部数据,已有的BI也不支持这种分析。联想对新型BI的部署就是在为积累大数据之后的应用做准备。
早就和大数据密不可分的是互联网行业,阿里巴巴是其中的领头羊,它不仅自建BI支撑起庞大的阿里系,而且在数加平台上将BI的各个环节产品化。数加团队对于传统BI的七寸之处,自然多有研究。阿里云BI产品经理解敏总结了几个常见的技术难点:数据仓库的建设,ETCL(抽取、转换、清洗和加载)过程涉及面广,工作量大;多种数据源的数据管理困难;BI建模实施时间长;海量数据分析处理速度慢;大多数深度的数据挖掘算法及工具还没普及到普通用户都可触手可及的地步。这些困难都是企业接入互联网数据后将要遇到的困难。
在走访了多家努力实现互联网+的传统企业后,我愕然认识到,传统企业的互联网+过程绝不是加减法,而是脱胎换骨的大手术,包括大数据的积累和应用;要渡过这个劫,直接引入互联网企业的经验远远不够。