下个世纪是大数据的世纪,是从IT走向认知计算的时代。在IT时代成就了一家超级平台,这就是淘宝,而认知时代要做的是数据的生意,那是否有一个类似淘宝的超级数据平台呢?IBM正在做这件事情。
IBM在全球布局了40多个基于Softlayer的数据中心,以Bluemix作为其主力云端开发平台, 在之上通过合作和收购网罗了从Twitter到The Weather Company以及这些年投入250亿美金收购的Cognos、SPSS、ILOG、Algo等诸多顶尖分析公司,再加上收购的Compose 所囊括的业界7大开源数据库等,以期搭建一个“淘宝”式超级数据平台。
2016年3月底,IBM向中国市场披露了其数据分析战略——由多个专有及开源数据库、多种大数据及商业分析算法以及多种数据源接入的“淘宝式”超级平台,再通过优化的后台管理、运维和用户体验,为上至专业开发者下至普通小白用户,提供各类数据服务。
跨越数据管理鸿沟
大数据时代的核心价值是数据分析,这个已经成为共识。但数据分析需要有数据,有数据就需要有数据库和数据库管理服务。
那么,现在一共有多少种数据库产品?由澳大利亚IT咨询公司solid IT创建的数据库知识网DB-Engines,就监控了全球260多种流行的数据库产品,其中包括商用数据库产品以及开源数据库产品,涵盖关系型和非关系型数据数据库。
面对这么庞大的数据库产品及服务,即便是专业开发者也要忘而兴叹了。特别是当数据库与云服务结合形成了云数据服务,即在混合云环境中部署数据库及数据分析服务,除了核心数据库管理外,还涉及到跨云的数据存储、迁移、热备、整合等复杂的云管理技术。
异构数据、异构数据库、异构云环境,这就成为了现代企业面临的数据管理鸿沟。对于IBM等企业级IT服务商来说,如何帮助企业跨越数据管理鸿沟,就成了绕不开的问题。于是就出现了IBM过去几年大力收购数据及数据库管理公司的现象。
大数据“淘宝”商城
IBM的数据分析战略包括了数据分析服务、云数据服务、数据集成服务、数据治理服务、数据集市、跨云的数据连接、混合云管理及云存储服务、行业解决方案和开发者服务等在内的完整链条,这些构成了IBM在大数据时代的“淘宝”商城。
在这个大数据“淘宝”商城中,最重要的“宝贝”就是云数据服务(提供DBaaS数据库即服务),即各种流行数据库的云化、集成、优化与管理。这是什么意思呢?以IBM收购的Compose为例,2015年7月IBM收购了开源数据库管理公司Compose。Compose是一家能为企业用户管理MongoDB、PostgreSQL、Elasticsearch、Redis、RethinkDB、etcd、RabbitMQ等七种最流行开源数据库的服务商。
Compose为用户提供的增值服务包括:由专家负责的24×7全天候数据库监控与管理、数据库的容器化及部署、不间断和无故障的数据库服务、不同数据库之间的数据迁移等。目前,Compose已经为数千家企业用户创建和管理了超过十万个数据库。
而早在2011年IBM就已经推出于基于Apache Hadoop的大数据分析服务商用版InfoSphere BigInsights和InfoSphere Streams。2015年,IBM进一步强化了实时数据分析,通过Apache Spark重新设计了超过15个核心分析与商务解决方案,例如基于Spark技术把数据准备和优化服务IBM DataWorks的代码库从4,000万行代码压缩至500万行。IBM还推出了基于Bluemix平台的Spark-as-a-Service服务。
IBM在2014年收购的Cloudant更是大名鼎鼎,这家创业公司的产品是基于开源CouchDB架构的托管数据库。Cloudant的强项在于永不宕机、动态扩容以及分布式异地多活存储,特别适合电商、在线游戏、金融支付等应用场景。
当然IBM自有的数据库和数据仓库产品,包括经典的DB2数据库、DB2 BLU(内存列存储加速)、dashDB(内存列存储数据仓库)、Informix(TimeSeries)等,都拥有大批的传统企业用户,这些产品经过云化后也成为IBM云数据服务的一部分。
目前,IBM提供了25种专有及开源数据库的云数据服务。IBM大中华区副总裁、大数据与分析事业部总经理丁少忠表示,IBM云数据服务的核心竞争力在于拥有这些数据库的源码,在源码级为用户提供管理服务(Managed Service),这极大降低了企业IT和开发者的负担。
除了这25种数据库即服务外,IBM还在2016年初推出了云化的中间件WebSphere Connect,其中包括了DataWorks、API Connect、APP Connect等组件,进一步扩展了IBM连接更多数据及云服务的能力。
引入预测分析和更多数据源
在IBM的数据分析战略中,云数据服务是用户当前马上就可以用到的服务,而面向未来的预测性数据分析才是IBM真正希望带来更高商业价值的服务。
目前IBM的预测性数据分析服务包括了Watson Analytics以及SPSS for Machine Learning两大类。其中,基于认知计算的Watson Analytics,以自然语言交互和可视化分析界面,把机器学习和预测性数据分析的门槛降低到了最低。
普通人没有经过专业训练,也能用Watson Analytics完成商业预测分析。市场营销、HR专员、金融分析等能简单直接地用Watson Analytics实现高级认知分析,比如直接向Watson Analytics提问后,Watson Analytics能采集、提取、精简数据,并从中发现趋势、预测成果、执行可视化分析、创建报告或仪表板等,而且整个过程都可以用自然语言交互。
Watson Analytics分为免费版、个人版和企业版,其中的免费版就已经能提供丰富的功能了。Watson Analytics在全球已有超过一百万注册用户,在大中华区刚刚推出就获得了近2万个注册用户。
SPSS for Machine Learning则是基于经典的统计分析软件SPSS。2009年,IBM以12亿美元收购了SPSS公司,随后又扩充了统计学分析运算、数据挖掘、预测分析和决策支持任务等丰富的功能。有着40多年历史的SPSS,是目前应用最广泛的数据挖掘预测工具。
除了向中国引进Watson Analytics和SPSS for Machine Learning外,IBM还引入了超过150种公共和免费数据源构成的信息库,其中包括了刚收购的The Weather Company。作为美国第四大使用最频繁的App,Weather公司每天处理高达260亿条云服务查询,是IBM数据服务和Watson物联网业务的支柱。
借助Weather公司的平台,IBM现在可以收集来自世界各地数十亿个物联网传感器的数据,这些数据来自于汽车和飞机远程信息处理系统、建筑和环境传感器、可穿戴的设备、医用植入物、气象站、智能手机、社交媒体、制造生产线和供应链等。接下来,IBM在中国市场将率先推出针对航空公司、媒体、手机厂商等多个领域的服务与合作。
继发力认知商业和认知计算后,IBM的大数据与分析业务也将在中国市场逐一落地,为中国的企业、开发者以及软件开发商等,搭起一个面向认知商业时代的“淘宝”式超级数据平台。有了这个超级数据平台,物联网、智慧城市、智能制造等新经济、新业务形态才能真正发展起来。