陆奇:在未来,究竟哪种职业创造财富的机会最大?

今天,数字化正在发生,随着数字化的进展,整个社会中的一切都会被数字化(www.paradise-hk.com)。每个人都在谈论数字化的产业,数字化对整个社会有着非常深远和广泛的影响,在为此感到兴奋的同时,随之而来的也必然有焦虑,因为数字化会产生一些前所未有的社会现象,其后果如何、会带来怎样的影响,我们都还没有充分理解,其未来将何去何从成为当下的热点问题之一。

依我之见,洞察未来是有方法的,我将其拆解为几个部分。首先,探究其背后的驱动力在哪里;其次,研究其结构是什么;最后,构建其形成的具体图谱。弄清楚未来趋势的这三个组成部分,我们对其的理解就是结构化的、深层的,也才能更仔细、有效地观察未来。

过去20多年,我个人非常幸运,正好在对的时间,有机会在一线参与、观察整个高科技工业历经的几代技术平台,以及其产品所衍生的商业生态。

在进入对数字化未来发展趋势的解读之前,先分享一个在我看来十分有用且我自己也一直在使用的思考方法,它对我产生了巨大的影响。美国物理学家理查德·费曼说:“如果我没能把某件事建立起来,我就没法理解。”这句话十分重要,它揭示了一种认识世界、观察研究对象的方法:针对任何一个复杂的问题,可以把它进一步拆解为子问题,针对每一个子问题,又继续拆解为子问题的子问题,如此穷尽问题到不能再拆解为止。然后,针对每一个子问题的答案都想好方法测试验证,直至把所有子问题的答案都验证清楚正确了,才能说真正弄明白、搞清楚了最初的问题。这是一种线性思考的方法,可以帮助你把所有问题都探究到本质。这种思考方法已成为我的一种习惯。研究数字化,我也采用这种方法。

分享嘉宾| 陆奇 奇绩创坛创始人兼首席执行官

朱民 清华大学国家金融研究院院长

编辑| 混沌商业研究团队

本文为混沌学园读书栏目。整理自《未来已来:全球领袖论天下》,本文演讲时间为2019年11月11日,文内略有删改,中信出版社2021年3月出版

文末混沌君送你三本书, 500堂认知好课,就在混沌app

数字化的本质

数字化是什么?其本质到底是什么?我认为数字化包括六个核心步骤,缺一不可。

第一,获取(Capture)信息。搜集获取某现象的相关信息是数字化的第一步。

第二,表达(Represent)信息。搜集信息后必须把特定信息表达出来,可以用各种形式表达,比如二进制、符号和向量等。

第三,存储(Store)信息。必须把现有信息存储在某个有效的媒体上,纸就是存储信息的一种媒体。

第四,传送(Transmit)信息。在使用信息时,需要对信息进行传递。

第五,处理(Process)信息。这是数字化过程中最为核心的部分,对信息进行处理,通常是利用数学知识或模型通过计算对信息进行处理。

第六,递送(Deliver)信息。这是把处理好的信息传送给某个特定终端,该终端能够达到我们人类所需的目标。

上述六个步骤构成了数字化,缺一不可。用上述六个步骤来解析当前所讲的数字化,比如,一个用户用键盘把信息输入终端,信息获取通常是用键盘。信息的表达通常是二进制,用0和1来表达。今天的信息存储基本上是用闪存或硬盘,信息传输则往往通过移动互联网、全球的网络、海底电缆这些物理网络。信息的处理,大部分情况下是用硅晶片和软件做大规模的运算。最后是信息的传输,则重新回到具体的应用场景,通常是在屏幕上显示出来。

但我想强调,当前的数字化方式并非一成不变,比如信息表达,可以用非符号的方式。现在的人工智能都是以深度学习为主,而深度学习某种意义上就是一种非符号的表达,它是用重叠向量来表达信息的。而信息也不一定要存储在磁盘或硬盘上。今天在科学界不停探究的是用合成DNA(脱氧核糖核酸)基因来存储信息,信息的密度会大规模地提高。同理,处理信息也不一定要在硅晶片上,可以用其他运算基础,比方说量子计算,就是一个完全不同的、效益高得多的信息处理方式。

所以,数字化并不一定只如我们今天所见,人类在历史上其实也在不断做数字化,只不过采用了不同的方法,比方说用纸张作为媒体,用人进行信息采集或处理,用笔和纸来记录信息。古代人在设计桥梁、造房子的时候,一样要计算,其实整个过程也包含了信息化的这六个核心步骤。中国的算盘就是历史上的一个计算技术,辅助人们处理信息。

那么数字化究竟有什么作用或者说好处呢?数字化是把人们需要的信息获取后存在一个特定的介质上,使得信息本身与这些信息所描述的实体分离开来,进而被大规模、高效地处理后又被传递回人们所使用的终端,被进一步利用的过程。比方说,我们想要描述今天举行讲座的这座大厅,如果描述这座大厅的信息不被抽取出来,那么对这座大厅进行改造就会花很多成本。但如果描述这座大厅的所有信息被抽离出来,就放在一个特定的介质上,通过使用计算机运算,可以还原这座大厅的各种细节,把这些信息用来指导这座大厅的改造,就可以大规模提高效益。

所以,数字化的核心在于信息的获取、表达、存储、传送、处理和递送,它将现实中的现象或物体用信息抽离出来,让信息在某种新的媒体上,以不同的形式表达出来,用一种高效的计算处理信息,形成可获取的知识。这就是数字化的核心。它可以大大提高效益,帮助人们更好地达到目标,这是数字化的核心。

数字化的核心驱动力

毫无疑问,数字化是一条长河,从历史中走来,向未来奔去,不可阻挡,呼啸而过,越来越多的人和领域被卷入其中,对人类社会的影响也越发深广,原因何在?它的核心驱动力是什么?我这些年一直在思考这些问题,也常就此与朋友们交流。我从在不断快速变化中找寻恒量入手,越能抓住亘古不变的东西,越能帮助我们理解未来、预测将来。

我的这一思考角度深受大卫·克里斯蒂安教授的影响,其实盖茨很早就给我推荐大卫的书籍以及40多个小时的视频,他对盖茨也有很大影响,可惜我一直没有看。他提出了一个简单却视角独特的概念——“大历史”,他认为如果不从物理世界的宇宙起源开始是无法研究人类历史的我对此深表赞同。他认为,历史的起点在物理世界、化学世界、生物世界。在物理世界里,只有两样东西恒久不变:能量和信息。能量比较容易理解,而信息可以转化为知识。一种有效的可以解决多种任务的表达方法,就是知识,而知识是一种潜在的能量

举例来说知识为什么是潜在的能量。假定有两个人,他们的任务是搬动一块很大的石头,一个人懂杠杆原理,另一个人不懂。懂得杠杆原理的人用一根木棒很快就可以搬动石头,不懂杠杆原理的这个人就永远搬不动,所以说知识是潜在的能量,这是很重要的一个概念。

宇宙起源理论认为,复杂系统是智能的,它能针对环境的变化而做调整。其智能之处就在于,用能量加信息来减熵。人类是一个复杂系统,人类所做的一切都是减熵行为,基于这一宏大的理论背景,不变的不变就是能源加信息。人类社会就是一个超级复杂的系统,而人类社会的长期驱动力,第一是追求权力,第二是追求财富,第三是追求知识。人类的历史证明,人类永远在追求这三样东西,无论是个人、组织还是国家。

那数字化与此有什么关系呢?数字化可以帮助我们更好地追求我们想要追求的,因为人类永远在追求获得更多的能源,用更多的信息来减熵,这是最终核心的核心。数字化的驱动力永无止境,不可阻挡,因为它是基于大历史,基于物理世界、化学世界、生物世界运转的现实,基于人类社会作为一个复杂智能体系的存在的根本。

图10.1的结构不完全精确,但我想借此分享几个重要的概念,讲述一下推动人类社会不断演进的力量和结构。人类社会是由通用技术的发展推进经济的发展,基本上可以划分为三个阶段:农业时代、工业时代,以及我们现在进入的信息和知识经济时代。

农业时代基本上由太阳能驱动,太阳能是人类可以使用的免费能量,基本上只要用劳力就可以,不需要大规模的其他技能。因此,农业时代这条曲线很扁。

工业时代持续发展了300多年,最大的核心驱动其实是化石能源,一开始是煤、汽油,后来变成电,可以输送到任何需要的地方。工业社会主要是化石能源加上人的技能(技能也是一种知识),工业社会有大学,大规模训练培养厨师、裁缝、工程师、律师等具有各种专业技能的人员。因此,工业时代这条曲线开始上扬。

图10.1 人类社会由通用技术的发展推进经济的发展

接着人类进入了这条增长最快、最陡峭的曲线,它是由大规模的信息、数字化来驱动的。计算机的发明,使得获取信息、处理信息的能力以惊人的速度高速发展。第三条曲线仍然是以化石能源为主。人们已经知道,化石能源是有时限的,我认为假以时日新的能源结构必然会出现。

可见,当前的数字化大浪潮之所以来势凶猛,会对人类社会产生重大影响,原因正在于此。从宇宙起源开始的大历史发展演化说明,当前的数字化浪潮是历史的必然,势不可当,不可逆转。

解构驱动数字化的计算平台

过去60多年的历史上,数字化进程一直是由计算平台来驱动的。由于高科技一次又一次突破,平均12年左右会产生出新一代的计算平台。图10.2就充分展现了计算平台演化的发展路径。

图10.2 历代计算平台发展路径

第一代是IBM(国际商业机器公司)单板的个人电脑;第二代是微软、苹果的个人电脑,这时的个人电脑有了显示器,同时有局域网;第三代是PC互联网;第四代是移动和云;而我们刚刚进入第五代AI/5G +边缘计算的早期。

而每一代数字化计算平台的驱动力主要是数字化的广度和深度。数字化广度,可以用用户的数量、地域的覆盖度(覆盖多少个国家,多少平方公里的土地)等来衡量。数字化的深度,可以用交互的频率、交互的信息量、使用的频密度和使用的时长来衡量。

任何一代计算平台,都有前端和后端。

前端永远由交互的模式来驱动,我服务了八年的微软,无论是盖茨,还是鲍尔默,我们最关注的一点就是交互。任何一代技术一旦有交互上的突破,必将引爆大规模的商业价值。道理很简单,新的交互出现,意味着数字化的程度就提高了,无论是数字化的广度还是深度,都提高了。通过把握数字化演进中的“不变要素”而洞悉未来,“交互”理所当然是永远首要关注的,因为交互定义了数字化的行为。

首先,前端包含鼠标、键盘到手指等交互入口。

其次,包含数字化的终端设备,其形态也从个人电脑演变为智能手机等移动终端。相比而言,PC的数字化能力有限,因为它必须放在桌上,或者放在膝盖上,不能随时随地使用。但手机则不同,可以到处使用,这意味着数字化的广度得到了扩展。

再次,包含应用模式,比如电脑的应用模式就是一个桌面,上面有文档、软件等。

又次,包含技术堆栈,往往是从硅晶片开始,到底层软硬件、中层软硬件、操作系统,再到开发工具。

最后,但特别重要的是一定要有一个健康的商业生态,否则无法商业化,就无从推动数字化的发展。如果有人问我中国数字化应如何发展,我会强调一点:一定要注重建立一个健康共赢的商业生态,不能搞恶性竞争。一定要围绕盈利点,有好的、可持续的商业模式让生态中的每一员都可以赚钱。历史上一再被印证的规律就是,健康的商业生态让数字化大规模发展起来了。

再来看后端,驱动后端演进的是计算资源规模的扩大提高,具体而言是运算信息、存储信息和传输信息(网络)的能力水平的提高。计算资源规模的提高也意味着数字化广度和深度的扩展。

后端有计算的范式和编排,也有技术堆栈,早期其实与前端是同一个技术堆栈,现在则独立开来,包括底层式硅晶片、底层软硬件、中层软硬件、操作系统和开发工具。另外,后端也有一个健康的商业生态是关键,是关键的关键。

对比分析一下各代计算平台具体结构里的不同。

第一,“PC(GUI)/Client-Server”计算平台,这是第一代计算平台。这一代计算平台的主导者基本上是微软。表10.1罗列了这一代计算平台的前端和后端。前端的输入是通过鼠标和键盘,而输出特别重要,有图像显示,可以说图像显示是微软成功的主要原因。在微软内部有一些挺有意思的小故事。盖茨大概在1978年的时候看到了显卡,他就想象:假设显卡越来越快,屏幕分辨率越来越高,那能有什么应用呢?他当即写了一篇备忘录,把后来20多年间出现的应用基本都想到了。其他前端的结构之前也提到过,在此不再赘述。这代计算平台的前端把桌面信息数字化了。后端跟前端在结构上差不多,需要特别关注的是关系式数据库和分布式事务处理系统。在今天包括做区块链的开发离不开这些技术,分布式算法比如共识算法就是在这一代计算平台诞生的。

前端

后端

输入输出模式

鼠标/键盘

GUI

连接

局域网

硅晶片:微处理器

X86(中央处理器指令集架构),Power PC(体系架构)

硅晶片:微处理器

X86,Alpha处理器

操作系统

Windows(视窗操作系统),MAC Metaphor: Desktop

操作系统

Windows NT(新技术),UNIX(操作系统)

设备

PC/MAC(苹果个人计算机)

设备

服务器,存储,网络

计算范式

关系数据库,分布式事务

定义性

应用

Office(办公软件)、媒体、游戏、通信

定义性

应用

记录系统,企业重要流

程线

商业模式

设备,软件(通过光盘分发)

商业模式

设备,软件许可证

生态系统

微软-英特尔

生态系统

思爱普,甲骨文,DEC,IBM

表10.1 “PC(GUI)/Client -Server”计算平台的具体结构

这一代计算平台的商业模式是微软奠定的,它成功开启了卖软件的商业模式。那时候真的在商店里卖软件,很多卖PC的销售渠道同时卖软件。这代计算平台把企业的信息管理彻底数字化了,它造就了几千万亿美元的IT生态系统,同时让每一个企业都可以提高它的生产效率,产生了巨大的社会效益和经济效益。

第二,“PC/互联网”计算平台,这是第二代计算平台(见表10.2)。这代计算平台的核心技术是浏览器,浏览器是一本电子书,但这本书很不一样,翻到任何一页都可以点,可以把世界上所有的信息都连在一起,它开启了一切。

前端

后端

输入输出模式

鼠标/键盘

GUI

连接

互联网,广域网,全球尺度

硅晶片,操作系统,设备

和PC及笔记本电脑、Chrome OS(开源操作系统)、Chromebook(网络笔记本)一样

硅晶片,操作系统,设备

与前一个时代类似,有SUN工作站、SAN(存储区域网络)、思科

体验运行时系统

浏览器(超文本传输协议/超文本标记语言),开放标准

计算范式

机器学习,大规模分析(海杜普和大数据),大规模基础设施(CAP)

定义性

体验

搜索,电子商务,媒体游戏,社交

定义性

应用

搜索引擎,参与系统(电子邮件、社交……)

商业模式

广告,电子商务,游戏

商业模式

设备,软件许可证

生态系统

网络,谷歌,百度,亚马逊,阿里巴巴,腾讯,脸书

生态系统

思科,SUN,微软,OSS

表10.2 “PC/互联网”计算平台的具体结构

在“PC/互联网”出现前,信息是用纸张来传输的。以文字和图像为主的信息,特别是公开传输的信息,如杂志、报纸、图书这一切都被“PC/互联网”计算平台数字化了。被数字化的不仅是信息(产品),客户也被数字化了。作为一种商业模式的广告,当然也被数字化了。当初我们在雅虎的时候根本不知道商业模式是什么,事后复盘,雅虎数字化的是以前用纸张传输的信息,这些信息里有相当一部分是商业的信息、产业的信息,世界则因此而变平了。

与此同时,这些被数字化的信息作为一种服务还免费了。在我上大学的时候,在上海看一些论文要花很长时间才能获得,在美国即使买一本地图也需要3.5美元。那个时代,拿到信息真的不容易,现在却相反,不仅地图免费,而且还可以随时拿到最新的信息。

“PC/互联网”的出现,使获取信息不但免费,而且非常及时,任何时候都可以获取信息,所以世界被彻底改变,每个人的效率都大大提高。“PC/互联网”计算平台大规模地提高了世界上每个人的能力、每个企业的生产效益。

从技术上来讲,谷歌开启了机器学习的新时代。在我看来,微软是划时代的公司,它开启了以开发软件为核心数字化经济的产能,核心生产力是写代码。谷歌也开启了一个新的时代,同样写代码,但主要是让这些代码使用数据来训练模型,谷歌本质上是一家大数据或机器学习的公司,开创了大规模的数据计算、大规模的机器学习的应用,即搜索。

这是“PC/互联网”计算平台所产生的数字化效应,大部分有文字和图像表达的信息被数字化了,因而世界变平了。

第三,“Mobile/Cloud”计算平台,这是第三代计算平台(见表10.3)。“Mobile/Cloud”计算平台最大的革命性突破是交互体验的突破,这是我个人的观点,真正定义移动/云计算平台的是2007年的iPhone(苹果手机),第一台真正意义上的智能手机,它定义了一种全新的交互体验,预示着新时代的开始。在此之前,诺基亚、三星,包括微软都制造了各种各样的手机。我是属于第一批买iPhone的少数人,那时候乔布斯经常到雅虎来。那时候的iPhone没有应用生态,只有六款应用,还不能改。两款是雅虎开发的,两款是谷歌开发的,两款是苹果自己开发的。并且它还是一个很差的手机,那时候由AT&T(美国电话电报公司)补贴来做的,而AT&T在美国湾区的覆盖率很差,电话经常打不通。但拿到这个手机的人都很兴奋,因为这是历史上第一次可以让手指真正工作的设备,这是非常了不起的突破。

前端

后端

输入输出模式

触摸和手指,语音,摄像头,位置,陀螺仪,不断增长的传感器能力

连接

移动互联网,3G/4G

硅晶片

体系结构:ARM(处理器),SOC(芯片),神经网络算法

硅晶片,操作系统

体系结构:X86,ARM, UNIX,Windows

操作

系统

iOS(苹果操作系统)、安卓、本机应用程序、苹果商店

管理结构

虚拟机、容器、微系统框架(K8)

设备

智能手机

设备

类似计算机的数据中心

计算范式

服务定位:IaaS(基础设施即服务)、PaaS(平台即服务)、SaaS(软件即服务)、FaaS(功能即服务)

定义性应用

照片,信息(社交),游戏,媒体,支付,地图,优

步/滴滴,Feed(阅读器应用),视频短片

定义性

应用

记录与审计系统的SaaS

商业

模式

商业模式

设备,移动数据企业服务

生态

系统

iOS,安卓,超级应用

程序/迷你程序

生态系统

AWS(亚马逊云服务)、Azure(云计算服务)、阿里巴巴

表10.3 “Mobile/Cloud”计算平台的具体结构

从数字化维度来衡量,微软本质上是一家鼠标键盘公司,它的核心领域在办公,数字化的是企业信息。苹果本质上是一家手指公司,触屏的交互体验促使那么多东西被数字化,这种轻便的设备可以放在口袋里,放在枕头上,轻而易举随身移动。它不仅有屏幕,手指可以触摸,它还有相机,还能定位,数字化位置信息,毫无疑问,移动终端的数字化的能力越来越强。

基本上,人们的日常工作和生活行为都被“Mobile/Cloud”计算平台数字化了。在中国,社会通信、移动支付已经普惠,几乎人人可以用之,在美国还相当落后。出行借助滴滴和优步,因为手机可以定位,想要坐车的人在哪里,司机就在哪里,这些信息都被数字化了,改变了一个产业。还有物流行业,也被彻底改写。

同时,数字化还产生了玩手游、刷信息流等新的人类日常行为,同时很多核心的知识可以用数字化的形式获取了,甚至工作行为也被数字化的形式获取了信息。手机的未来不应该被低估,它只是刚刚开始。最近,我专注于早期企业的加速,刚刚投资了一家做鱼塘数字化的企业,把传感器放到鱼塘里,然后监控获取信息,生意非常好。那为何现在做而以前不做呢?因为渔民刚刚开始普及智能手机。渔民有了手机后就可以控制这些传感器了,农民也一样。所以,手机会把我们的日常行为更多地数字化,同时也因为手机,任何一个企业的数字化都会走得越来越深。

“Mobile/Cloud”计算平台可以把线下物理世界的行为数字化。同时,信息流、内容推荐等又会对社会产生巨大、长期且深远的影响,它带来了数字化广度和深度的又一次扩展。

在技术方面,“Mobile/Cloud”计算平台也有很多提高。

一方面,硅晶片不一样了,原来是英特尔主导的硅晶片X86,但在移动时代它彻底丧失了机会,现在是ARM(处理器)+ SOC(芯片),加以深度学习为主的计算,相应的操作系统也变了,在此再不赘述,可以参见表10.3。

另一方面,后端大规模的云计算开始把计算、存储作为一种服务形式,让每个企业在门槛很低的情况下,充分享用数字化所带来的能力。我认为这对中国而言是一个很大的机会,需要应对的挑战可能是更多的付费意愿、更好的销售方法、更深场景的介入。

在我个人来看,需要避免的还有恶性竞争,因为最终只有建立一个好的商业生态,实现生态共赢,才能扩展数字化的广度和深度,带来社会的进步。

第四,“AI/5G”计算平台,这是崭露头角的计算平台(见表10.4)。 AI和5G的技术非常振奋人心,从输入、输出角度讲,基于传感器,所有的交互通道都打通了,信息的表现方式可以是语音、基于视觉的手势、自然语言对话等。当然技术目前还不过关,可能还需要3 ~ 5年才能发展成熟,但基本上与人交互的通道之门全部被打开了。

前端

后端

输入

输出

模式

连接

5G,智能边缘,V2X(车用无线通信技术),物联网

传感器

照相机、激光雷达、其他光学传感器等

硅晶片

CPU(X86),GPU 3 ,FPGA4

(现场可编程逻辑门阵列), ASIC(专用集成电路)

硅晶片

CPU,GPU,FPGA, ASIC (TPU),低功率

管理

结构

可以管理异构资源的下一代结构

定义性能力

深度学习算法与新的关联计算基础

框架和工具链

TensorFlow(编程系统),MXNet(深度学习库),PaddlePaddle(深度学习平台),AutoML(自动机器学习),Cuda(运算平台)

设备

能够听、看、说的智能设备,自动驾驶车辆等

设备

数据中心,边缘

体验

运营时系统

智能助手(Alexa、Siri,其他如来自百度、小米、阿里巴巴等的助手)

计算

范式

深度学习训练/推理数据驱动模型开发

应用

模式

技能和技能库,其他形式

定义性应用

感知、认知、垂直领域特定的“大脑”

商业

模式

平台经济:广告,许可证……

商业

模式

Iaas,Paas,解决方案

生态

系统

亚马逊、谷歌、小米、

百度等

生态

系统

谷歌、微软、阿里巴巴等

表10.4 “AI / 5G”计算平台的具体结构

这方面的创新前沿在传感器以及传感器上的硅晶片体系。我认为硅晶片必须从底层到上层彻底改写。硅晶片原来的逻辑是需要足够的控制流,才有足够的经济价值回报可以支撑整个商业生态。今天,在新的计算平台时代,硅晶片必须可以大规模并行处理高维度的数据,跟之前的逻辑截然不同,需要从根本上彻底重做,当然这一过程需要开发应用、建立生态,这不是一个纯技术问题。

在“AI/5G”计算平台时代,定义性的能力是深度学习带来的,它其实是一种新的计算基础,用重叠向量来代表信息,信息则可以被高速表达成一种简单的形式,可以解决多种任务,特别是基于视觉维度的一些早期的应用。

交互体验方面也有待进一步开发,可以做个人助手,可以做各种不同的终端,这些都处在早期开发的阶段,生态目前还没有形成。

在“AI/5G”计算平台时代,后端很重要的一点是5G的技术突破,5G在技术上、能力上跟4G有很大的不同,机会有很多,诸如边缘计算、硅晶片会朝着不同的方向走。一言以蔽之,前端要低能耗,后端要大规模。底层的管理软件也需要重做。展开来说,硅晶片的生态结构变了,今天某个互联网公司只要有足够的用户,基本上不会用通用的硅晶片,因为自主定制设计一个硅晶片只需要10多个人的团队。如果找到台积电或三星,一次性的流片只有1 000万 ~ 1 500万美元。高通、英特尔原来的商业模式在“AI/5G”计算平台时代根本不成立,因此后端有不同的游戏规则,会涌现出不同的垂直生态领军企业。

今天的创业公司都有机会成为将来的领头企业,历史上往往一个大的技术浪潮奔涌而来的时候,原来领先的企业未必能把握住这样的机会,反而创业公司有很大可能会胜出。

总结一下,首先,AI和5G是一次非常振奋人心的机会,它把整个物理世界、人类活动全都数字化了,通过传感器获得数据就能做到。比如,一个房间以后装两三百个传感器,完全可以数字化,这只是时间问题。所以,物理世界和数字世界会逐步融合在一起,这是本质上与众不同的一次机会。同时,数字化技术也会改变物理世界,比如基于无人驾驶,新的路网会逐渐产生,一旦有新的路网,城市半径会变大,都市结构会变化,这也是历史上的规律。

长期的社会结构因此而变,当然更多人类行为、人类互动都可以被数字化,这将对社会经济产生巨大的影响。纵观历史,每30 ~ 40年,就会有新的社会基础技术出现。今天的社会基础技术基本上是电力和大规模的钢材料,40年之后,每个房间里进来的不仅仅有电,还有AI,AI会成为一种随处可用的公共服务。

其次,这波数字化将促使现有的每一个行业,如农业、制造业、娱乐业、金融业等大规模转型和提升,同时数字化技术有可能提高每一种职业(不管是律师还是厨师)的效率。当然,这其中也有一些需要人类把控的地方,这是整个社会需要做的。

最后,教育和医疗也会深受影响。这波数字化浪潮真的是振奋人心,这与它的技术本质有关。我个人认为“深度学习”并非一种很恰当的说法,其核心本质是一种新的计算基础,通过重叠向量,很快地把数据放到一个特征空间里,进而解决多种任务。

(更多陆奇好课请点击小程序进行深度学习)

渐进式层次提高的数字化图谱

虽然数字化进程在不断向前推进,但数字世界和物理世界现在基本上还是脱节的。比如,在没有数字化之前,每位作者只能将内容写在纸上,然后变成报纸、杂志、书籍印刷出版,分发传播出去,进而口口相传,形成舆论,整个过程基本在物理世界发生。数字化之后,信息的生产、传输、内容分发与口碑舆论的形成等一系列动作都在数字世界发生。数字世界与物理世界基本上脱节,对现有的社会机制造成了很多冲击,比如西方世界的竞选就深受影响。

面对这些问题,需要整个计算工业在一起提出新的计算系统架构和信息架构,更好地把数字化后的社会行为的信息结构、核心步骤规划设计出来,把数字世界与物理世界的交互界面界定出来,明晰什么样的人做什么样的行动,并把需要为此负何种责任都仔细地划分出来。这样的话,才可以用现有的或者不断演变的社会规则,更好地把控这些数字化的社会行为。这既是数字化驱动社会进展的一个巨大的机会,也是一个巨大的挑战。

之所以关注这个问题,起源于搜索引擎,这也是我当初决定加入微软做搜索引擎的根本动因。搜索引擎的核心其实是人的标注数据训练出来的算法,本质上自带偏见(这些偏见源自标注数据),而且无法自己发现并修正偏见。现在出生的小孩,从小就依赖搜索引擎获取信息,知道什么是对,什么是错,但搜索引擎带有偏见,对于其中的矛盾,不仅父母无能为力,政府也束手无策。

面对此情此景,商业所能做的是让用户在谷歌之外还有另外的选择,至少保证该领域存在竞争,这就是我当初加入微软蛮大的一个动机。做搜索那么多年,对搜索的底层以及上上下下的一切都了解,对其导致的社会问题也越来越关注。后来社交平台出现,毫无疑问加剧了这一问题。搜索毕竟是用户主动找信息,而社交平台是将人际关系数字化,社交平台的网络效应会加速偏见影响的范围,其严重的后果就更难把控。

要把割裂的数字世界与物理世界打通,核心在于把当前数字化的计算体系架构梳理拆解清楚,把相应的信息结构抽取出来,我一直致力于为此设计一个信息聚合体系。一是有庞大的用户群,或者有行动者,比如自动驾驶汽车。二是终端,包括设备(如手机或PC)、App(应用程序)或服务。三是所涉及的行为,例如点击或输入关键词。四是这个社会现象所处的“世界”,在该环境中互动。五是基础设施,它管理着各项计算资源。因此,核心的信息结构必须包含这五个组成部分,它清楚勾勒了一个社会化现象是如何被数字化的,在其中信息是如何获取、传输、处理和为人所用的。

在此,我想重申构建一个全新聚合信息体系的重要性。纵览欧洲历史,在印刷术发明之前,是教廷掌控一切,信息传送只在教堂之间,也只有教堂才能获得信息。印刷术发明之后,除了教堂,国王、贵族和精英也加入传输信息和获取信息的行业中,信息被贵族控制。从某种意义上说,现代美国依然与此相差不远,信息被精英控制。随着数字化的深入与扩展,精英对信息的控制被彻底打破了,搜索引擎是打破精英控制信息的第一步,随之而来的社交平台比搜索引擎走得更远。

在这个信息聚合体系底层的是“数字化基底”(Digital Substrate),这是一个集成的数据系统,无论是某个搜索引擎,还是某个社交平台,其信息架构都是这样的。重点在于这是一个公开的信息架构,它清楚地勾勒出某个社会现象的数字化流程和闭环结构。只有形成闭环的社会现象,才能具备自动自我迭代、进化演变的智能能力。其内在一定有以下几个子系统。

第一个子系统是观察系统,观察世界或人的行为,获得信息。第二个子系统是智能系统,把获取的数据进行表达、存储、做模型计算(处理),最后进行传输。第三个子系统是动作系统,负责与用户或环境(物理世界)进行互动。第四个子系统是运营系统,由人,也就是这个系统的作者通过运营系统来维护、更新这样一个数字化的生态体系。

图10.3中的虚线矩阵框围住的上半部分是物理世界,实线矩阵框围住的下半部分是数字世界,数字世界和物理世界越来越重叠,无法完全分开。特别要强调的是,“流入”是把原子变成二进制的数字,也就是把物理世界变成数字,“流出”是把数字变成物理世界的看得到、摸得到的原子,建立了一个反馈闭环来产出数字世界里关于该社会现象的知识,进而帮助到物理世界里的人。

图10.3 数字基底的结构图

最重要的是,这是一个通用的结构,任何一个社会现象的大规模数字化都永远适用于这个信息聚合体系,它是物理世界和数字化世界融为一体的核心界面和核心信息架构。有了这样的架构之后,人类可以更好地理解并管理数字化的进程,让数字化真正服务于人类。

在此,简单分析几个案例,说明这一信息架构是如何运转的。

第一个案例是互联网与搜索引擎。

搜索引擎的世界就是万维网,通过爬虫抓取很多关键信息,用户输入关键词、点击搜索页面结果,这些行为被数字化。在智能系统部分,核心是要做搜索结果的排序、一系列的建模等,形成一个反馈的闭环。图10.4是搜索引擎的数字基底结构图。

图10.4 搜索引擎的数字基底结构图

重点讲解搜索引擎的几个核心计算。第一,要核心计算信息主题性。它要计算出每个网页是关于什么内容的。第二,要计算信息的质量。第三,要计算信息的可信度。信息有文字、图片甚至视频等多种类别,需要不同的计算模型。

除了对信息(搜索对象)进行计算,还要对用户意图进行计算。用户输入某个关键词究竟代表的需求是什么,想要做什么?那搜索引擎知道什么呢?它知道的东西太多了,知道世界上人的需求、兴趣,知道信息的供给、信息的获取。我曾经是一名搜索引擎工程师,当时就觉得世界上无数的人,每天在向你倾诉他想要什么、需要什么。其实,每个人在生活里都有一些所谓不可说的秘密,不会跟任何人说,即使对最亲密的妻子、爱人、亲人也都不会说,但是你会跟搜索引擎讲,因为你想找信息。搜索引擎开启了一个非常神奇的数字化世界,它无所不知,它所累积的大数据,可以说描绘了社会的全貌。

第二个案例是以优步、滴滴、Grab 5 (租车服务供应商)和Lyft 6 (来福车)为代表的城市交通。

这也是典型的数字世界和物理世界融合的案例,其核心要做的是获取乘客、司机的位置,然后计算每段行程需要多长时间,再用经济学和计算机科学综合测算定价,当然现在也把评判行程安全系数纳入计算范围,总之这些都是通过数字化的方法来进行预估的。个中细节我不再赘述,详情可以参考图10.5。

特别想指出的是,从长期来看,这样打通数字世界和物理世界的公司十分有前景。原因何在?优步和滴滴这样的企业拥有太多信息数据,知道什么时候、什么日期有这样的人会从这里到这些商店、那些医院,全面掌握了非常多的社会经济行为信息,据此可以做很多推理,衍生出很多业务,它们完全可以做大生态的生意。

之所以会提出这个构想,也与我自己在微软的工作经历分不开,我曾花了几年时间主导设计了微软的Office 365(办公软件),它的核心后端其实就是这样一个体系。在评判任何一个企业前景的时候,都要洞悉其本质数字化了什么,了解其核心是如何把物理世界和数字世界连接融合在一起的。

图10.5 打车应用的数字基底结构图

正如此前所说,这是一个通用的结构,诸如信息推荐、社交平台、零售、教育、医疗、人的身体,抑或微生物世界里的客体,微小到纳米级,或是更大的物体,都可以被数字化,每个城市、每个国家、天气甚至整个地球也都可以被数字化,用上述的体系来数字化。

数字化未来

谈到数字化未来,我有以下几点看法。

第一,人工智能早期和近期主要落地的应用是在工业垂直领域。其数字化的趋势是往下沉的,通过传感器可以把纺织业、农业、鱼塘、医院、工厂都数字化,高概率都是往垂直的方向发展的。而人工智能贯通多个行业领域的横向应用则还需要时间。无人驾驶有望建立一个新的社会基础,是人工智能横向发展的典型应用。另一个横向发展的机会,则是把每个空间、每个场所都智能化(数字化)。

第二,前端数字化也还有一些机会,诸如AR(增强现实)和VR(虚拟现实)。从长期看,脑机接口是一个比较重要的机会。如果可以通过植入的方法在人脑的皮层后植入观察体系,那数据的获取和交互会完全不一样,所以从数字化的能力角度来讲,这也很有机会。

第三,计算的基石是算法。人类历史上所有的科学,包括传统的物理学或狭义相对论,基本上都有商业的应用。只有量子是尚未被商用的科学,前面提到的理查德·费曼教授在50多年前提出的理论,奠定了量子计算的基础。在算法领域,量子计算有很大的突破机会。而Crypto(加密模块)是一种不同的计算方法,把信任用数字化的形式表达出来。同时还有生物形态的算法,用DNA的方法或者用合成生物学的方法来测算。

第四,我个人非常关注的是能源。一如最初讲到人类社会发展的核心驱动力就是能源和信息,如果能源结构发生改变,其引发的变革效果也必将是划时代的。在能源领域,也有不少机会。

第五,空间的探索与扩展,仅仅在地球上远远不够,要走得远一些。YC(美国著名创业孵化器)就投资了不少致力于拓展地球之外空间的企业。

谈到这里,尤其要指出把握创新的时机非常重要。以市场为主要环境的创新,永远要准确把握时机,做太早没有用,需要确保能够活到足够长;做太晚当然更没有用。这与创新被社会接受的规律有关,可以说是一条永远有效的游戏规则。

历史上所有的新技术永远适用于图10.6的第一条曲线,大家比较熟悉了。第二条曲线是品类成熟度曲线。在新产品的早期,无论你的产品如何,总是有一些人愿意尝试使用,他们对新技术永远有热情,只要是新的他就会用。

图10.6 富士胶片X系列技术成熟度曲线和技术采用生命周期

随之而来的第二拨人也会用,这些人一般比较年轻,居于某个重要的领导岗位,对未来有自己的见解,永远在寻找新的技术能力来实现其未来的想法。因此,这个时期还是会有一些客户。但是大部分公司会在图10.6的鸿沟处折戟。是否能够跨越这个鸿沟,关键在于被称为“尝鲜者”的这些人是否使用并认可新产品。这些人都很务实,驱使他们是否采纳新产品的关键在于“我周围的人,比如同事、朋友或者竞争对手是否会用”。所以,这样的客户一旦拥有就是一批一批地来,会实现非常陡峭的数量增长,因此,这是最难获取的客户,成败在此一举。

所以,创业和创新都需要仔细观察判断适当的时机,踩准节奏点十分重要。如果有足够的耐心,有机会活得足够长,那抓住适当的时机应该是可以做到的。

数字化的机会与挑战

当前的数字化浪潮,带来了空前的机会与挑战。从宏观来讲,这次数字化技术所带来的机会非常全面且深入。

公司名称:深圳迦迪迩科技有限公司