Skip to content

AI 革命:通往超级智能之路 · The AI Revolution: The Road to Superintelligence

原文:https://waitbutwhy.com/2015/01/artificial-intelligence-revolution-1.html · 2015-01-22

PDF: 我们做了一个精美的 PDF 版本,方便打印和离线阅读。在这里购买。(或者看一下预览。)

注: 这篇文章花了我三个星期才写完,因为当我深入研究人工智能时,我简直不敢相信*自己看到的东西。我很快就意识到,AI 领域正在发生的事情不只是一个重要话题,而是远远超过其他一切,是关乎我们未来的最重要话题。所以我想尽可能多地学习相关知识,而一旦学完,我又想确保自己写出一篇真正能解释清楚整件事以及它为何如此重要的文章。不出意料,这篇文章长得离谱,所以我把它分成了两部分。这是第一部分——第二部分在这里。*

我们正处于一场变革的边缘,其规模堪比人类生命在地球上的崛起。——弗诺·文奇 (Vernor Vinge)

站在这里是什么感觉?

Edge1

这看起来是个挺刺激的位置——但你得记住站在时间图表上的一个特点:你看不到右边有什么。所以站在那里实际的感觉是这样的:

Edge

感觉……大概挺正常的。

遥远的未来——即将到来

想象一下坐时光机回到 1750 年——那是一个世界处于永久停电状态的年代,长距离通讯意味着要么大声喊,要么朝天放炮,所有交通工具都靠干草驱动。到了那里之后,你拽上一个人,把他带回 2015 年,然后带他四处走走,看看他对一切的反应。我们根本无法想象,他看到这些会是什么感觉:闪闪发光的胶囊在高速公路上飞驰,跟当天早上还在大洋彼岸的人通话,观看 1000 英里外正在进行的体育比赛,听 50 年前的音乐演出,玩我那个魔法巫师矩形——他可以用它捕捉真实的图像、记录鲜活的瞬间,生成一张带有超自然移动蓝点显示他位置的地图,看着某人的脸和他们聊天,即使对方在国家的另一端,以及无数其他难以想象的巫术。这还没给他看互联网,也没解释国际空间站、大型强子对撞机、核武器或广义相对论之类的东西呢。

对他来说,这种体验不算惊讶、震惊,甚至「炸裂」都不够形容——这些词都不够大。他可能真的会当场死掉。

但有趣的是——如果他随后回到 1750 年,因为我们见到了他的反应而眼红,决定自己也要试一把,他会坐上时光机,回到同样长的时间之前,从大约 1500 年抓一个人过来,带到 1750 年,把一切都展示给他看。那个 1500 年来的家伙肯定会被许多东西震惊——但他不会被吓死。这次经历对他来说会远没有那么疯狂,因为虽然 1500 年和 1750 年差别很大,但这个差别远远小于 1750 年到 2015 年的差别。1500 年的人会学到一些关于太空和物理的烧脑玩意儿,他会对欧洲在新一轮帝国主义浪潮中表现出的执着印象深刻,他也得对自己脑中的世界地图做一些重大修订。但看着 1750 年的日常生活——交通、通讯之类的——绝对不至于把他吓死。

不行,要让 1750 年的家伙获得和我们整他时一样多的乐趣,他得回到更久以前——也许得一路回到公元前 12000 年左右,在第一次农业革命催生出最初的城市和文明这个概念之前。如果有个来自纯粹狩猎采集世界的人——那时候人类不过是众多动物物种中的一员——看到了 1750 年广袤的人类帝国,看到那些高耸入云的教堂、横渡海洋的船只、「室内」这个概念,还有人类集体积累的庞大知识与发现——他多半会被吓死。

那么,如果他被吓死之后,也眼红了,想做同样的事呢?如果他回到 12000 年前,也就是公元前 24000 年,抓个人带到公元前 12000 年,他把一切展示给这个人看,这个人大概会说:「行吧,你想说啥啊谁在乎。」要让公元前 12000 年的家伙获得同等乐趣,他得回到 10 万多年前,找一个他可以第一次给他展示火和语言的人。

为了让一个人被传送到未来后被震惊到吓死,他必须前进足够多年,以至于达到了「足以致死的进步量」,或者叫一个「致死进步单位 (Die Progress Unit, DPU)」。所以在狩猎采集时代,一个 DPU 需要超过 10 万年;但按照农业革命之后的速度,只需要大约 12000 年。后工业革命的世界发展得太快了,一个 1750 年的人只需要前进区区几百年,就足以达成一个 DPU。

这种模式——人类的进步随着时间推移变得越来越快——正是未来学家雷·库兹韦尔 (Ray Kurzweil) 所说的人类历史的加速回报定律 (Law of Accelerating Returns)。出现这种情况是因为更先进的社会有能力以比落后社会更快的速率前进——正因为它们更先进。19 世纪的人类比 15 世纪的人类知道更多、技术更好,所以 19 世纪的人类比 15 世纪的人类取得多得多的进步并不奇怪——15 世纪的人类根本不是 19 世纪人类的对手。11← 点开这些

这在更小的尺度上也成立。电影《回到未来 (Back to the Future)》1985 年上映,"过去"设定在 1955 年。电影里,当迈克尔·J·福克斯 (Michael J. Fox) 回到 1955 年时,他被电视机的新奇、汽水的价格、人们对刺耳电吉他的不感冒,以及俚语的差异搞得措手不及。那确实是个不同的世界——但如果这部电影放到今天来拍,"过去"设定在 1985 年,那它可以拿大得多的差异玩出多得多的花样。主角将穿越到一个没有个人电脑、没有互联网、没有手机的年代——今天的马蒂·麦克弗莱 (Marty McFly),一个生于 90 年代末的少年,在 1985 年的格格不入程度,会远远超过电影里那个马蒂在 1955 年的格格不入程度。

这背后的原因和我们刚刚讨论的一样——加速回报定律。1985 到 2015 年之间的平均进步速率高于 1955 到 1985 年之间的速率——因为前者是个更先进的世界——所以最近这 30 年发生的变化,比之前那 30 年要多得多。

所以——进步正变得越来越大,速度也越来越快。这暗示了一些关于我们未来相当劲爆的事情,对吧?

库兹韦尔认为,以 2000 年的进步速率,整个 20 世纪的进步在 20 年内就能完成——换句话说,到 2000 年,进步速率已经是 20 世纪平均进步速率的 5 倍。他相信 2000 到 2014 年之间又发生了相当于 20 世纪一整个世纪的进步,而再一个 20 世纪量级的进步将在 2021 年之前发生,只用 7 年。再过几十年,他相信一个 20 世纪量级的进步会在同一年内发生好几次,再往后,会在不到一个月内发生。总而言之,由于加速回报定律,库兹韦尔相信 21 世纪取得的进步将是 20 世纪的 1000 倍2

如果库兹韦尔和那些赞同他的人是对的,那我们到 2030 年时被震撼的程度,可能就跟我们那位 1750 年的老兄被 2015 年震撼的程度差不多——也就是说,下一个 DPU 可能只需要几十年——而 2050 年的世界可能跟今天的世界如此天差地别,我们几乎都认不出来。

这不是科幻小说。这是许多比你我都聪明、知识也都更渊博的科学家所坚信的——而且如果你看一下历史,这也是我们逻辑上应该预测到的。

那么,当你听我说出「35 年后的世界可能完全无法辨认」这种话时,为什么你心里想的却是「酷……但是不可能吧」?我们对未来的离奇预测持怀疑态度,有三个原因:

1) 谈到历史时,我们习惯用直线思维。 当我们设想未来 30 年的进步时,会回头看过去 30 年的进步,把它当作未来可能发生多少变化的参照。当我们思考 21 世纪世界会变化到什么程度时,我们就直接把 20 世纪的进步加到 2000 年这个起点上。这跟我们那位 1750 年的老兄犯的错误是一样的——他把 1500 年的人拽过来,以为对方会像他自己往前同样距离时被震撼到的程度那样被震撼。我们最直觉的思考方式是线性的,但我们其实应该指数地思考。如果有人聪明一点,他可能会不再用过去 30 年来预测未来 30 年的进步,而是用当前的进步速率为基准来判断。这样会更准确一些,但还是差得离谱。要想正确地思考未来,你需要想象事物以比现在快得多的速率在移动。

Projections

2) 最近一段时期的发展轨迹常常讲述的是一个被扭曲的故事。 首先,即使是一条陡峭的指数曲线,当你只看其中很小的一段时,它看起来也是线性的——就像你近距离看一个巨大圆环的一小段,它看起来几乎是一条直线。其次,指数增长并不是完全平滑、均匀的。库兹韦尔 (Kurzweil) 解释说,进步是以「S 形曲线」的方式发生的:

S-Curves

当一个新范式席卷世界时,进步的浪潮便画出一个 S 形。这条曲线经历三个阶段:

1. 缓慢增长(指数增长的早期阶段) 2. 快速增长(指数增长的后期、爆炸性阶段) 3. 随着该特定范式走向成熟,增长趋于平稳3

如果你只看非常近期的历史,你当前所处的 S 型曲线那一段会模糊你对事情推进速度的感知。1995 年到 2007 年这段时间,互联网爆炸式增长,微软 (Microsoft)、谷歌 (Google) 和 Facebook 走进公众视野,社交网络诞生,手机以及之后的智能手机问世。那是第二阶段:S 形曲线里的爆发增长部分。但 2008 到 2015 年就没那么开创性了,至少在技术层面是这样。今天有人思考未来时,可能会拿最近几年来衡量当前的发展速度,但这其实漏掉了更大的图景。事实上,一波全新的、巨大的第二阶段增长爆发,可能正在此刻酝酿之中。

3) 我们自身的经验让我们在面对未来时变成了固执的老头。 我们关于世界的想法都建立在个人经验上,而这些经验把近期过去的增长速度灌输进我们脑子里,变成了「事情就是这么发生的」。我们还受限于自己的想象力——想象力以经验为原料来勾勒对未来的预测——但很多时候,我们所知的那点东西根本不足以让我们准确地思考未来。2 当我们听到一个与我们基于经验的「事情是这么运作的」观念相矛盾的未来预测时,我们的直觉就是这个预测肯定太天真。如果在这篇文章后面我告诉你,你可能活到 150 岁、250 岁,或者根本不会死,你的直觉会是:「这太蠢了——如果说历史教给我什么,那就是所有人都会死。」没错,过去没有谁没死过。但飞机发明之前,也没有人开过飞机。

所以,你读这篇文章的时候呃不会吧这种感觉可能很对劲,但它其实多半是错的。事实是,如果我们真正讲逻辑、并且预期历史规律会延续下去,那我们应该得出的结论是:未来几十年里发生的变化,会比我们直觉预期的要多得多得多。逻辑还告诉我们,如果一个星球上最先进的物种持续以越来越快的速度迈出越来越大的飞跃,那么在某个时刻,他们将迈出一次如此巨大的飞跃,以至于彻底改变他们所熟知的生活,以及他们对「身为人类意味着什么」的理解——有点像进化过程一直朝着智能迈出大步,最终迈到「人类」这一步时,彻底改变了任何生物在地球上生存的意义。如果你花点时间读一读今天科学和技术领域正在发生的事,你会开始看到许多迹象,在悄悄暗示:我们当前所熟知的这种生活,撑不过即将到来的下一次飞跃。


通往超级智能之路

什么是 AI?

如果你跟我一样,以前你大概觉得人工智能 (Artificial Intelligence) 是个傻乎乎的科幻概念,但最近你听到一些严肃的人在谈论它,而你其实没怎么搞懂。

很多人对 AI 这个词感到困惑,有三个原因:

1) 我们把 AI 和电影联系在一起。《星球大战》。《终结者》。《2001 太空漫游》。甚至《杰森一家》。这些都是虚构的,里面的机器人角色也是虚构的。所以 AI 在我们听起来就有点像虚构的东西。

**2) AI 是一个很宽泛的话题。**它的范围从你手机里的计算器,到自动驾驶汽车,再到未来某种可能彻底改变世界的东西。AI 指的是所有这些东西,这就让人犯糊涂了。

**3) 我们日常生活中一直在用 AI,但我们常常没意识到那就是 AI。**1956 年发明「人工智能」这个词的约翰·麦卡锡 (John McCarthy) 抱怨道:「一旦它能用了,就没人再叫它 AI 了。」4 因为这种现象,AI 听起来更像是关于未来的神话预测,而不是现实。同时,它又听起来像是过去某个从未真正实现的流行概念。雷·库兹韦尔 (Ray Kurzweil) 说他听人讲 AI 在 1980 年代就枯萎了,他把这种说法比作「坚持说互联网在 2000 年代初的互联网泡沫中死掉了」。5

所以咱们先把事情理清楚。首先,别再想着机器人了。机器人只是 AI 的一个容器,有时候模仿人形,有时候不模仿——但 AI 本身是机器人里面的那台计算机。AI 是大脑,机器人是它的身体——如果它有身体的话。比如说,Siri 背后的软件和数据是 AI,我们听到的那个女声是这个 AI 的拟人化,而这里头根本没有机器人。

其次,你大概听过「奇点」或者「技术奇点」这个词。这个词在数学里用来描述一种类似渐近线的情况,在那种情况下,常规规则不再适用。在物理学里,它被用来描述像无限小、无限致密的黑洞,或者大爆炸前我们都被挤压进去的那个点。同样,都是常规规则不适用的情形。1993 年,弗诺·文奇 (Vernor Vinge) 写了一篇著名的文章,他把这个词用到了未来某一刻——技术的智能超越我们自身的那一刻——对他来说,从那一刻起,我们所熟知的生活将永远改变,常规规则将不再适用。后来雷·库兹韦尔又把事情搞得有点乱,他把奇点定义为加速回报定律达到如此极端的速度,以至于技术进步以一种看似无限的速度在发生的那个时刻,之后我们就将生活在一个全新的世界里。我发现今天许多 AI 思考者已经不再用这个词了,反正它也挺让人困惑,所以我在这里也不会怎么用它(尽管我们整篇都会围绕着那个想法展开)。

最后,虽然 AI 是个宽泛的概念,所以有许多不同的类型或形式,但我们需要思考的关键分类是基于 AI 的水平。AI 水平主要分为三大类:

AI 级别 1) 弱人工智能 (Artificial Narrow Intelligence, ANI): 有时也被称为Weak AI,弱人工智能是专精于某一个领域的 AI。比如有能在国际象棋上打败世界冠军的 AI,但它也就只会下棋这一件事。你让它琢磨一下怎么在硬盘上更高效地存数据,它只会一脸茫然地看着你。

AI 级别 2) 强人工智能 (Artificial General Intelligence, AGI): 有时也被称为Strong AI,或者Human-Level AI(人类级 AI),强人工智能指的是一台全方位跟人一样聪明的计算机——一台能完成任何人类智力任务的机器。打造 AGI 比打造 ANI 难太多了,我们现在还没做到。Linda Gottfredson 教授把智能描述为「一种非常综合的心智能力,它涉及推理、规划、解决问题、抽象思考、理解复杂概念、快速学习以及从经验中学习等能力」。AGI 能像你一样轻松地搞定这些事。

AI 级别 3) 超人工智能 (Artificial Superintelligence, ASI): 牛津哲学家、AI 领域的顶尖思想家 Nick Bostrom 超级智能定义为「在几乎所有领域——包括科学创造力、综合智慧和社交能力——都比人类最聪明的大脑还要聪明得多的智力」。超人工智能的范围可以从只比人聪明一点点的计算机,一直到比人聪明万亿倍的计算机——全方位的聪明。ASI 正是 AI 这个话题如此火爆的原因,也是为什么「永生」和「灭绝」这两个词会在本系列文章里反复出现。

到目前为止,人类已经在很多方面征服了最低级别的 AI——ANI,它无处不在。AI 革命就是从 ANI,经过 AGI,再到 ASI 的这条路——一条我们或许能挺过来、或许挺不过来的路,但不管怎样,它都会改变一切。

让我们仔细看看这个领域的顶尖思想家们认为这条路是什么样的,以及这场革命为什么可能会比你想象的来得早得多:

我们现在在哪——一个由 ANI 驱动的世界

弱人工智能是指在某件具体的事上等同于或超过人类智能或效率的机器智能。举几个例子:

  • 汽车里塞满了 ANI 系统,从决定防抱死刹车何时启动的电脑,到调节燃油喷射系统参数的电脑都是。谷歌的无人驾驶汽车正在测试中,它里面会有一套强大的 ANI 系统,让它能感知周围的世界并作出反应。
  • 你的手机就是个小型 ANI 工厂。当你用地图 app 导航、收到 Pandora 量身定制的音乐推荐、查明天的天气、跟 Siri 说话,或者做几十种其他日常活动时,你用的都是 ANI。
  • 你的邮箱垃圾邮件过滤器是种经典的 ANI——它一开始就装载了关于如何分辨垃圾邮件的智能,然后随着接触你的具体偏好,它会学习并把自己的智能调整成适合你的样子。Nest 恒温器也是一样,它会开始摸清你的日常作息并据此行动。
  • 你知道那种很诡异的事吗——你在亚马逊上搜了个产品,然后在另一个网站上看到它作为「为你推荐」的产品出现;或者 Facebook 莫名其妙就知道你该加谁为好友?那是一整个 ANI 系统网络,它们协同工作,互相通报你是谁、你喜欢什么,然后用这些信息决定给你看什么。亚马逊的「买了这个的人还买了……」也是一样——那是一个 ANI 系统,它的工作就是从数百万顾客的行为里收集信息,综合处理后巧妙地向你追加销售,好让你买更多东西。
  • 谷歌翻译是另一个经典的 ANI 系统——在一个狭窄任务上表现得惊人地好。语音识别是又一个,还有一堆 app 把这两个 ANI 当组合拳来用,让你能用一种语言说一句话,手机就用另一种语言把同样的话吐出来。
  • 飞机降落时,决定它去哪个登机口的不是人。就像决定你机票价格的也不是人一样。
  • 世界上最强的跳棋、国际象棋、拼字游戏 (Scrabble)、双陆棋 (Backgammon) 和奥赛罗棋 (Othello) 玩家现在全都是 ANI 系统。
  • 谷歌搜索就是一个庞大的 ANI 大脑,有着极其复杂的方法给网页排名、决定具体给你看什么。Facebook 的信息流也一样。
  • 而这些还只是消费者层面。复杂的 ANI 系统在军事、制造业、金融等行业和领域被广泛使用(算法高频 AI 交易员占了美国市场股票交易量的一半以上6),还有像帮医生做诊断的专家系统,以及最有名的 IBM Watson——它装载了足够多的事实,也足够理解 Trebek 那种俏皮的提问方式,从而干净利落地击败了《危险边缘》(Jeopardy) 最高产的几位冠军。

当下的 ANI 系统并不特别可怕。最糟糕的情况下,一个有 bug 或者编程不当的 ANI 可能会引发某种孤立的灾难,比如让电网瘫痪、导致核电站发生有害故障,或者触发金融市场灾难(比如 2010 年的闪电崩盘 (Flash Crash),当时一个 ANI 程序对一个意外情况做出了错误反应,导致股市短暂暴跌,蒸发了 1 万亿美元的市值,错误被纠正后也只挽回了一部分)。

但虽然 ANI 没有能力造成 生存威胁 (existential threat),我们应当把这个日益庞大复杂、相对无害的 ANI 生态系统,看作是即将到来的那场改变世界的飓风的前兆。每一项新的 ANI 创新都在悄悄地为通往 AGI 和 ASI 的路上添砖加瓦。或者像 Aaron Saenz 所看到的那样,我们这个世界的 ANI 系统「就像早期地球原始浓汤里的氨基酸」——那些无生命的生命原料,在某个意料之外的日子,醒过来了。

从 ANI 到 AGI 之路

为什么这么难

没什么比尝试去造一台和我们一样聪明的电脑,更能让你领会到人类智能有多了不起的了——你会发现这件事难得令人难以置信。盖摩天大楼、把人送上太空、搞清楚宇宙大爆炸的细节——这些全都比理解我们自己的大脑、或者造出一个像它一样酷的东西要容易得多。截至目前,人脑是已知宇宙中最复杂的物体。

有意思的是,造 AGI(一种 全方位 都和人一样聪明的电脑,而不是只在某个狭窄领域厉害)的难点,直觉上根本不是你以为的那些地方。造一台能在零点几秒里把两个十位数相乘的电脑——简单到爆。造一台能看一眼狗、然后回答这是狗还是猫的电脑——难得离谱。做一个能在国际象棋里击败任何人类的 AI?早就搞定了。做一个能读懂一本六岁小孩的绘本里一段话的 AI,不只是认得那些字、还要理解它们的 意思?Google 目前正在花 数十亿 美元试图做到这件事。难的事情——比如微积分、金融市场策略、语言翻译——对电脑来说简单到让人麻木;而简单的事情——比如视觉、运动、移动、感知——对它来说难得发指。或者,用计算机科学家 Donald Knuth 的话说,「AI 目前已经成功做到了基本上一切需要『思考』的事情,却没能做到大部分人和动物『不用思考』就能做的事。」7

当你思考这个问题时,会很快意识到:那些对我们来说看起来轻而易举的事情,其实复杂得难以置信,它们只是看起来简单,因为这些技能已经被几亿年的动物进化在我们(以及大多数动物)身上优化到了极致。当你伸手去拿一个物体时,你肩膀、肘部和手腕里的肌肉、肌腱和骨骼,会瞬间配合你的眼睛执行一长串物理学运算,让你的手能在三维空间中沿直线移动。你觉得毫不费力,是因为你的大脑里有一套已经被打磨得完美的软件在干这件事。同理,网站让你注册新账号时那种歪七扭八的验证码,识别不出来不是因为恶意软件笨——而是因为你的大脑能识别出来,这件事本身简直牛逼到不可思议。

另一方面,做大数乘法或下棋对生物生物来说都是新活动,我们还没来得及进化出这方面的本事,所以电脑不用费太大劲就能击败我们。想想看——你更愿意写一个能做大数乘法的程序,还是一个能透彻理解 B 这个字母本质、以至于你给它看成千上万种无法预测的字体或手写体里的 B,它都能瞬间识别出这是 B 的程序?

举个有意思的例子——当你看到这张图时,你和电脑都能看出这是一个由两种不同色调交替组成的长方形:

Screen Shot 2015-01-21 at 12.59.21 AM

到目前为止打成平手。但如果你把黑色部分拿开,露出整张图……

Screen Shot 2015-01-21 at 12.59.54 AM

……你毫不费力就能完整描述出各种不透明和半透明的圆柱、板条以及三维拐角,但电脑会惨败。它只会描述它看到的东西——几种不同色调的二维形状的组合——而这其实才是图像里实际存在的内容。你的大脑则在背后做了一大堆花哨的操作来解读这张图想要传达的隐含深度、阴影混合和房间光照。8 而看下面这张图,电脑看到的是一张二维的黑白灰拼贴,而你一眼就能看出它真正是什么——一张全黑的三维石头的照片:

article-2053686-0E8BC15900000578-845634x330

图片来源:Matthew Lloyd

而我们刚才提到的这一切,还只是在被动接收静止的信息并加以处理。要达到人类级别的智能,计算机还得理解诸如微妙面部表情之间的差异、"高兴"、"如释重负"、"心满意足"、"称心如意"和"愉悦"之间的细微区别,以及为什么《勇敢的心》(Braveheart) 是经典,而《爱国者》(The Patriot) 却是烂片。

让人望而生畏。

那我们要怎么走到那一步?

创造 AGI 的第一把钥匙:提升算力

要让 AGI 成为可能,有一件事是必然要发生的——计算机硬件性能的提升。如果一个 AI 系统要达到大脑那种水平的智能,它就得在原始计算能力上跟大脑打个平手。

表达这个能力的一种方式是大脑每秒能完成的总计算次数 (cps),你可以通过算出大脑每个结构的最大 cps,然后把它们全加起来得到这个数字。

雷·库兹韦尔 (Ray Kurzweil) 想出了一个捷径:他拿某位专家对某一个脑结构 cps 的估计值,再结合这个结构占整个大脑的重量比例,按比例换算出整个大脑的总估计值。听起来有点不太靠谱,但他用不同脑区的多个专家估算值反复做了这个计算,结果总是落在同一个量级——大约 10^16,也就是 1 亿亿 cps。

目前,世界上最快的超级计算机——中国的天河二号——实际上已经超过了这个数字,达到了大约 3.4 亿亿 cps。但天河二号也是个混蛋,占地 720 平方米,耗电 24 兆瓦(而大脑只需要 20 瓦),造价 3.9 亿美元。还远谈不上能广泛使用,甚至连大多数商业或工业用途也还达不到。

库兹韦尔建议我们换个角度看计算机的发展状况:看看 1000 美元能买到多少 cps。当这个数字达到人脑级别——1 亿亿 cps 的时候——那就意味着 AGI 可能真的成为生活的一部分。

摩尔定律 (Moore's Law) 是一条历史上相当靠谱的规律:世界最大算力大约每两年翻一番,也就是说,计算机硬件的进步——就像人类历史上的总体进步一样——是指数级增长的。把这个规律套到库兹韦尔的 cps/1000 美元这个指标上看,我们目前大约处在 10 万亿 cps/1000 美元的水平,正好踩在下面这张图所预测的轨迹上:9

PPTExponentialGrowthofComputing-1

所以全世界 1000 美元的电脑现在已经超过老鼠大脑,大约达到了人类水平的千分之一。这听起来好像没什么大不了的,直到你回想起 1985 年我们大约处于人类水平的万亿分之一,1995 年是十亿分之一,2005 年是百万分之一。2015 年达到千分之一意味着我们正好按部就班地朝着 2025 年——届时一台买得起的电脑就能匹敌大脑算力——迈进。

所以在硬件方面,通用人工智能 (AGI) 所需的原始算力现在技术上已经有了,在中国,而且我们将在 10 年内迎来价格亲民、广泛普及的 AGI 级别硬件。但光有原始计算力并不能让电脑获得通用智能——下一个问题是,我们怎么把人类水平的智能注入到这些算力当中?

创造 AGI 的第二把钥匙:让它变聪明

这就是最棘手的部分了。说实话,没人真的知道怎么让它变聪明——我们还在争论怎么把电脑搞到人类智能水平、让它能认得出一只狗、一个写得歪歪扭扭的 B、还有一部平庸的电影是什么样的。但是确实有一堆听起来很离谱的策略,迟早其中某一个会奏效。下面是我接触到的三种最常见的策略:

1) 抄袭大脑。

这就好比一群科学家在苦思冥想:坐在他们旁边那个小孩怎么那么聪明、考试老是考那么好,而他们自己再怎么用功也远远不如那个小孩,最后他们终于决定:「去他妈的,我直接抄那小孩的答案算了。」这是有道理的——我们绞尽脑汁也造不出一台超级复杂的电脑,而每个人脑袋里恰好就有一个完美的原型摆在那里。

科学界正在努力对大脑进行逆向工程,以搞清楚进化是怎么造出这么屌的东西的——乐观的估计认为我们能在 2030 年前做到。一旦做成了,我们就会知道大脑为什么能运行得如此强大和高效的所有秘密,然后我们就能从中汲取灵感,顺便偷走它的那些创新。模仿大脑的计算机架构有一个例子,就是人工神经网络 (artificial neural network)。它一开始是一个由晶体管「神经元」组成的网络,彼此通过输入和输出相连,什么都不懂——就像婴儿的大脑一样。它「学习」的方式是去尝试完成某项任务,比如手写识别,一开始,它的神经元放电以及随之而来的对每个字母的猜测会完全是随机的。但当它被告知某个答案是对的,导致这个答案的放电路径上的晶体管连接就会被加强;当它被告知错了,那些路径上的连接就会被削弱。经过大量这样的试错和反馈之后,这个网络自己就形成了聪明的神经通路,机器也就为这个任务实现了优化。大脑也是有点像这样学习的,只是方式更精巧,随着我们继续研究大脑,我们正在发现各种巧妙的新方式来利用神经回路。

更极端的「抄袭」涉及一种叫「全脑仿真 (whole brain emulation)」的策略,目标是把一个真的大脑切成薄片,扫描每一片,用软件组装出一个精确的 3D 重建模型,然后在一台强大的计算机上运行这个模型。我们就拥有了一台正式能干大脑能干的所有事的计算机——它只需要学习和收集信息就行了。如果工程师们真的牛逼,他们能精确地仿真一个真实的大脑,精确到大脑的整个性格和记忆在被上传到计算机后都还完好无损。如果这个大脑在临终前属于 Jim,那这台计算机现在醒过来就是 Jim 了(?),它将是一个强大的人类级别的 AGI,然后我们就可以着手把 Jim 变成一个无法想象的超级智能 ASI 了,他大概会对此感到非常兴奋吧。

我们离实现全脑仿真还有多远?嗯,到目前为止,我们最近才刚刚能够仿真一条 1 毫米长的扁虫大脑,总共只有 302 个神经元。人脑包含 1000 亿个。如果这听起来让人觉得这项目没戏,别忘了指数级进步的威力——现在我们已经搞定了小小的扁虫大脑,蚂蚁应该也用不了多久,接下来是老鼠,然后突然之间这事就会显得靠谱多了。

2) 试着让进化做它之前做过的事,只不过这次是为了我们做。

所以如果我们觉得直接抄学霸的考卷太难,那就试试抄他备考的方法吧。

有一件事我们是知道的。造出一台和大脑一样强大的电脑可能的——我们自己大脑的进化就是证明。如果大脑实在太复杂、我们模拟不了,那我们可以试着去模拟进化本身。事实上,就算我们能模拟大脑,那也可能像通过模仿小鸟扑翅膀的动作来造飞机一样——很多时候,机器最好用一种全新的、面向机器的思路来设计,而不是死板地照抄生物。

那我们怎么模拟进化来造出 AGI 呢?这个方法叫做「遗传算法 (genetic algorithms)」,大致是这么运作的:有一个表现-评估的过程不断反复进行(就像生物通过活着来「表现」、通过能不能繁殖后代来被「评估」)。一群电脑会去尝试完成任务,表现最好的那些会被两两配对——把它们各自一半的程序合并到一台新电脑里。表现差的就被淘汰掉。经过非常非常多次迭代,这种自然选择过程就会产出越来越好的电脑。难点在于建立一套自动化的评估与繁殖循环,让这个进化过程能自己跑起来。

照抄进化的坏处是,进化喜欢用十亿年来搞事情,而我们想在几十年内搞定。

但我们比进化有很多优势。首先,进化没有远见,完全是随机的——它产生的没用的突变远多于有用的,而我们可以控制这个过程,只让有益的小故障和有针对性的微调来推动它。其次,进化并不针对任何目标,包括智能——有时候环境甚至会淘汰更高的智能(因为太耗能量了)。而我们可以专门把这个进化过程导向「提高智能」这个方向。第三,要选择出智能,进化得在一堆别的方面同步创新来支持智能——比如重新设计细胞产生能量的方式——而我们可以把这些额外负担甩掉,直接用电之类的东西。毫无疑问,我们会比进化快得多得多——但能不能快到足够让这成为一条可行路径,目前还说不准。

3) 把整个问题甩给电脑去解决,而不是我们自己解决。

这是科学家们走投无路时才用的招数,他们试着编程让考试自己考自己。但这可能是我们手头最有希望的方法。

这个想法是,我们要造一台计算机,它的两大本领是研究人工智能,以及把改动写回自己的代码——这样它不仅能学习,还能改进自己的架构。我们要教计算机当计算机科学家,这样它们就能自举地推动自身的发展。而这将是它们的主业——琢磨怎么让自己变得更聪明。这个后面再细说。

这一切可能很快就会发生

硬件的飞速进步和软件上的大胆实验正在同步发生,通用人工智能 (AGI) 可能会出其不意地、迅速地逼近我们,主要有两个原因:

  1. 指数级增长非常猛烈,看起来像蜗牛爬一样的进展可以瞬间一飞冲天——这张 GIF 把这个概念展现得很到位:

来源

  1. 在软件方面,进展看起来可能很慢,但某一次顿悟就能瞬间改变进步的速度(有点像当年人类以为宇宙是地心说的时候,科学家们费劲也算不清宇宙是怎么运转的,但日心说一被发现,一切突然就简单多了)。又或者,对于一台能自我改进的计算机来说,我们看起来似乎还很遥远,但实际上可能只差对系统做一处微调,它就能变得效率高出 1000 倍,然后嗖地一下飙升到人类水平的智能。

从 AGI 到 ASI 之路

到某个时候,我们将实现 AGI——拥有人类水平通用智能的计算机。一群人和一群计算机平等地生活在一起。

哦,其实根本不是这样。

事情是这样的:即便 AGI 拥有和人类完全相同水平的智力和计算能力,它相对人类仍然有显著的优势。比如:

硬件:

  • 速度。大脑的神经元顶多跑到 200 Hz,而今天的微处理器(等我们造出 AGI 的时候它们会比现在快得多)运行在 2 GHz,也就是比我们的神经元快 1000 万倍。大脑内部的通信速度大约是 120 米/秒,跟计算机能以光速进行光学通信的能力相比,简直惨不忍睹。
  • 尺寸和存储。大脑被锁死在颅骨的形状里出不去,反正它也大不了多少——再大的话,120 米/秒的内部通信就要花太长时间才能从一个脑结构传到另一个了。而计算机可以扩展到任意物理尺寸,可以塞进多得多的硬件、大得多的工作内存 (RAM),以及在容量和精度上都远超我们自己的长期记忆(硬盘存储)。
  • 可靠性和耐久性。不只是计算机的记忆更精确。计算机的晶体管比生物神经元更准确,也更不容易退化(就算退化了也可以修理或更换)。人脑还很容易疲劳,而计算机可以以巅峰性能 24/7 不间断地运行。

软件:

  • 可编辑性、可升级性,以及更广阔的可能性。和人脑不同,计算机软件可以接收更新和修复补丁,而且很容易拿来做实验。升级还可以延伸到人脑薄弱的领域。人类的视觉软件极其先进,但复杂的工程能力却相当低端。计算机可以在视觉软件上达到人类的水平,但同时也能在工程和其他任何领域上同样得到优化。
  • 集体能力。人类在构建庞大的集体智能这件事上,把所有其他物种碾压得稀碎。从语言的发展和大型密集社群的形成开始,经过文字和印刷的发明,如今通过互联网这类工具进一步强化,人类的集体智能是我们能远远甩开所有其他物种的主要原因之一。而计算机在这方面会比我们做得好得多。运行某个特定程序的全球 AI 网络可以定期同步自身,任何一台计算机学到的东西都会被瞬间上传到所有其他计算机。这个群体还能作为一个整体追求同一个目标,因为不一定会出现像人类群体中那样的异见、不同动机和自身利益冲突。10

通过被编程为自我改进而最终达到 AGI 的 AI,不会把「人类水平的智能」视为某个重要的里程碑——那只是从我们的视角看才有意义的标记——它也没有任何理由要在我们这个水平「停下来」。而且,考虑到即便是与人类智能相当的 AGI 相比于我们也具有的那些优势,显而易见的是,它只会在人类智能水平上短暂停留一瞬,就一路冲向超越人类智能的领域。

这事真发生的时候,可能会把我们吓个半死。原因在于,从我们的视角看,A) 虽然不同动物的智能各有差异,但我们对任何动物智能的主要印象就是——它远低于我们;B) 我们觉得最聪明的人类比最蠢的人类聪明得 多得多。大概像这样:

Intelligence

所以当 AI 的智能朝我们一路飙升时,我们会觉得它不过是作为一只动物变得越来越聪明而已。然后,当它达到人类能力的下限——Nick Bostrom 用的词是「村里的傻子」——我们会想:「哎哟,它跟一个笨人差不多了诶,真萌!」唯一的问题是,在宏大的智能光谱里,所有人类——从村里的傻子到爱因斯坦——都被挤在一段非常窄的区间内,所以刚刚达到村里傻子水平、被宣告为 AGI 的它,转眼就会比爱因斯坦还聪明,而我们都不知道自己被什么东西撞了:

Intelligence2

然后呢……再之后会发生什么?

智能爆炸

我希望你享受过正常时光,因为从这里开始,这个话题就要变得不正常、变得吓人了,而且从此一路都是这样。我想在这儿暂停一下,提醒你:我接下来要讲的每一件事都是真实的——是真实的科学,是来自一大批最受尊敬的思想家和科学家对未来的真实预测。请一直记住这一点。

总之,正如我上面所说,我们目前通往 AGI 的大多数路径,都涉及 AI 通过自我改进达到这一水平。而且一旦它达到了 AGI,即使是那些通过非自我改进方式形成和成长起来的系统,如今也已经聪明到——只要它想——就可以开始自我改进了。3

于是我们就来到了一个猛烈的概念:递归式自我改进 (recursive self-improvement)。它的运作方式是这样的——

一个处于某种水平的 AI 系统——比方说人类村里的傻瓜——被编程设定了一个目标:提升自己的智能。一旦它做到了,它就变聪明了——也许到了爱因斯坦的水平,那么现在当它再去改进自己的智能时,以爱因斯坦级别的智力,它做起来更轻松,也能迈出更大的步子。这些飞跃让它远远聪明过任何人类,从而能迈出更大的飞跃。随着步子越迈越大,频率越来越快,这个 AGI 的智能一飞冲天,很快达到 ASI 系统的超级智能水平。这就叫做智能爆炸 (Intelligence Explosion)11,也是加速回报定律 (The Law of Accelerating Returns) 的终极案例。

关于 AI 多快能达到人类水平的通用智能,目前还存在一些争论。一项针对数百名科学家的调查中,他们认为我们「更有可能已经实现 AGI」的中位年份是 2040 年12——也就是离现在只有 25 年。这听起来好像也不算多,直到你意识到这个领域的许多思想家认为,从 AGI 到 ASI 的跨越极有可能发生得非常快。大概是这样:

第一个 AI 系统要花上几十年才能达到低水平的通用智能,但最终它做到了。一台计算机能像四岁小孩一样理解周围的世界。突然之间,在达到这个里程碑后的一小时内,这个系统就抛出了统一广义相对论和量子力学的宏伟物理理论,这是人类从未能确切完成的事情。再过 90 分钟,这个 AI 就变成了 ASI,智能是人类的 17 万倍。

那种量级的超级智能,我们根本无法想象,就像大黄蜂没法理解凯恩斯经济学一样。在我们的世界里,聪明意味着 130 的 IQ,愚蠢意味着 85 的 IQ——我们连一个用来形容 12952 的 IQ 的词都没有。

我们所知道的是,人类在这颗地球上的绝对统治力提示了一条清晰的规则:*智能带来力量。*这意味着,一旦我们创造出 ASI,它将成为地球生命史上最强大的存在,所有生物,包括人类,都将完全受它支配——而这件事可能就发生在未来几十年内。

如果我们这种贫瘠的大脑都能发明出 wifi,那么比我们聪明 100 倍、1000 倍、或 10 亿倍的东西,要在任何时间以任何方式控制世界上每一个原子的位置,应该都不在话下——所有我们视为魔法的事情、我们想象中至高无上的神才拥有的每一种能力,对于 ASI 来说就像我们按下电灯开关一样稀松平常。创造逆转人类衰老的技术、治愈疾病和饥饿乃至死亡、重新编程天气以保护地球生命的未来——一切都突然成为可能。同样可能的是,地球上所有生命的瞬间终结。就我们而言,如果 ASI 诞生了,那么地球上就出现了一位全能的神——而对我们来说至关重要的问题是:

它会是一位友善的神吗?

这就是 本文第 2 部分 的主题。

(参考来源见 第 2 部分 底部。)

相关的 Wait But Why 文章

费米悖论 (The Fermi Paradox) – 为什么我们看不到任何外星生命的迹象?

SpaceX 将如何(以及为何)殖民火星 – 一篇我和 Elon Musk 合作完成的文章,它重塑了我对未来的心理图景。

或者,如果你想看点完全不同但又莫名相关的东西,试试 拖延症患者为什么拖延

还有 Wait But Why 第一年合集 的电子书。

如果你喜欢 Wait But Why,请订阅我们的 邮件列表,新文章一出来我们就会发给你。

想支持 Wait But Why,请访问我们的 Patreon 页面


  1. 好的,现在有两种不同的注释。蓝色圆圈里的是有趣/好玩的那种,你应该读一读。它们用于一些额外的信息或想法,我不想放进正文是因为它要么是某个话题的旁枝末节,要么是我想说的某些东西怪到不适合直接放在正文里。

  2. Kurzweil 指出,他的手机大约只有他 40 年前那台 MIT 电脑的百万分之一大、百万分之一价格,却强大 1000 倍。试着去想象未来与之相当的计算机进步会把我们带到何处,更别说一个远远、远远更极端的进步了,因为这种进步是指数级增长的。

  3. 关于一台电脑"想要"做某事意味着什么,在第 2 部分中会有详细得多的讨论。


  1. 灰色方块是无聊的东西,点开灰色方块,你也会觉得无聊。这些只用于引用来源。

  2. Kurzweil, The Singularity is Near, 39.

  3. Kurzweil, The Singularity is Near, 84.

  4. Vardi, Artificial Intelligence: Past and Future, 5.

  5. Kurzweil, The Singularity is Near, 392.

  6. Bostrom, Superintelligence: Paths, Dangers, Strategies, loc. 597

  7. Nilsson, The Quest for Artificial Intelligence: A History of Ideas and Achievements, 318.

  8. Pinker, How the Mind Works, 36.

  9. Kurzweil, The Singularity is Near, 118.

  10. Bostrom, Superintelligence: Paths, Dangers, Strategies, loc. 1500-1576.

  11. 这个词最早是历史上一位伟大的 AI 思想家 Irving John Good 在 1965 年使用的。

  12. Nick Bostrom, Superintelligence: Paths, Dangers, Strategies, loc. 660

Tweet