我最近的咨询客户是一家出版公司,正尝试以各种方式将内容数字化及脉络化。我知道该公司有某些竞争者已和IBM的华生研究中心(Watson)签约,便问了他们几位高层,为什么不和华生研究中心签约?该公司表示:「我们觉得人工智能(AI)软件正在迅速大众商品化,应该能用低得多的成本自己组合出需要的功能。」几位见多识广的经理也提到,他们预计公司会采用来自不同供应商、开放原始码的认知软件(cognitive software)。他们考虑采用的开放原始码软件供应商可不是小公司,而是Google、脸书(Facebook)、微软、亚马逊和雅虎等大公司。
听到该公司的策略,我起初有些讶异。能够思考的机器,已经变得这么便宜又容易取得了吗?认知软件市场还是个相对新的市场,居然就已经大众商品化了吗?厂商还正在努力开发奇特的深度学习(deep learning)功能和机器学习软件,为什么愿意免费提供?而如果IBM推出的软件不能明显优于免费软件,怎么能预估华生研究中心将有100亿美元的营收?
首先谈谈人工智能大众商品化的一些可能原因(至少在目前来说,人工智能比较适当的名称或许是「认知科技」)。今天所有软件的重大趋势是走向「微服务」,也就是对资料执行一小组功能,再回报结果。通常的形式就是应用程式介面(application program interface,API)。但这些软件较小型,因此比那些较大规模的软件更难说服使用者或组织付费。这些软件的规模小而且模组化,可供多位软件开发人员用来设计软件,因此应用程式介面常常会进入开放原始码的程式库。
在过去十年左右,认知软件领域的情形正是如此。现在已有许多开放原始码程式库,提供各种常见认知功能的演算法,像是神经网路、深度学习(就像是更强大的神经网路)、语音剖析(parsing)及辨识、影像辨识等等。某些程式库开放已久,但像是Google、微软、脸书和亚马逊则是到最近一、两年才免费开放。一般的存取方式是透过供应商的云端系统(供应商至少可借此赚点钱),或是透过像Github这样的程式网站。如果有很多公司和程式设计师使用某个特定供应商的开放原始码认知工具,就很有可能:1. 让这套软件成为标准;2. 这套软件很容易整合到同一个供应商的其他产品中。
就连IBM的华生研究中心也是往这个方向迈进,至少某个程度上是如此。虽然软件并非免费(打那么多广告,总是需要成本),但现在已经推出一组应用程式介面,可执行许多不同认知功能,包括影像分析、情绪分析,以及原始的问答功能。我计算华生研究中心「华生开发者云端」服务(Watson Developer Cloud)的目录,发现可以取得约20种应用程式介面,而这个数字不断变动,因为可能会有新增的应用程式介面、取消实验性质的应用程式介面,或者合并相关的应用程式介面。认知工具大众商品化的速度很快,因此,如果华生研究中心有部分应用程式介面在不久之后成为开放原始码程式,实在也不值得讶异。
另一项推动大众商品化的因素,则是发展出各种对话机器人(bot),或许也可称为「智能人类介面」。对话机器人(有时候使用全称「chatbot」)是一种小型应用程式,能让人透过文字或语音输入,与程式对话。要执行这种功能,需要先将语音转为文字、剖析那些文字、并且要能理解大量词汇。听来困难,但许多曾推出开放原始码人工智能软件的公司,现在也已提供对话机器人,可与它们自己的程式和和几乎其他所有程式沟通。对话机器人很快就会无所不在;现在甚至已经有一些开放原始码程式库了。而且,因为对话机器人只是介面(就像是我们打字或按滑鼠,但更简单),大概不会有人愿意为此付出高价。
这一切代表的是:想卖认知软件赚大钱,大概会相当困难。但当然,如果公司内部没有一整组资料科学家,就会需要大量这类的外部服务。很多公司也会需要相关谘询服务,设法了解该在本身的哪些业务里应用这些工具。我认为,未来应该会出现高度客制化的人工智能「解决方案」,这些方案十分精细、完全量身打造,因此不可能透过开放原始码来取得,例如能够辨识伪钞的影像分析系统。
但大致来说,这类型的软件应该会有很多,而且是免费的。如果你的公司知道这些软件的用处、用法,也知道如何整合到自己的业务里,前途就一片光明。但如果你的公司打算卖这种软件,前途可能就相当堪虑。