从人脑进化理解人工智能的涌现-526互联

引言：上周听了刘嘉老师的分享，越来越认可看懂人工智能需要从脑科学的角度去思考，基于分享的内容、自己的思考、收集的资料整理出本篇文章。

惊艳出现的ChatGPT还在被大家吐槽“胡说八道”，到GTP-4时，一下就从后10%的差生变成了前10%的尖子生，让大家都在问：

到底人工智能发生什么了？为什么现在突然这么厉害了？

人工智能本来就是在模拟人脑的，这个进化过程跟人脑进化很像，在2020年5月份，OpenAI的这些科学家把神经网络变大了，参数量一下从15亿级别变成1750亿，然后就涌现了现在的各种能力，这个变化就是“大力出奇迹，量变到质变”。

图1：GPT各版本参数量

人脑的进化

古代人类的大脑容量不到今天的三分之一。后来由于摄入高热量肉类（更多）和肠道变短（更高效的吸收），人类有多余的能量用于大脑发育，然而，人类发育大脑的过程极其缓慢，历经三百多万年。

图2：古代人类脑容量进化

南方古猿（学名：Australopiths）生活在385～295万年前，一般颅骨容量接近现存黑猩猩的头骨容量，约为300-500毫升，据估计，南方古猿的神经元总数约为30-35亿。
能人（学名：Home habills）生活在距今约200万～175万年前的东非和南非，考古时代相当于旧石器时代早期，一般认为能人后来可能进化成直立人，脑容量680毫升左右。
智人（学名：Homo sapiens）生活在距今25万～4万年前，主要特征是脑容量大，在1300毫升以上，据估计，智人有约400亿个神经元。
现代人脑的平均体积约为1352毫升，大致860亿个神经元（人类的大脑皮质包含大约140-160亿神经元, 小脑中包含大约550-700亿神经元）。

在过去的三百万年，人从能人变成现代人，主要有两个变化：

直立行走带来视觉系统的发达；
大脑的体积增加了三倍（相对于祖先，最初的人），这个在整个动物进化史里是唯一的一次；

脑容器的增加，出现了很多自涌现的现象出来。

意识的出现

意识的出现，典型就是知道我这个概念。

镜子测试就是检查是否有自我意识的实验。
111
图3：镜子实验，小狗并没意识到镜子里是它自己。

意识是如何产生的？
简单来说：当这个网络足够大时，意识就涌现了。

一般情况下人脑具有860亿个神经元，每个神经元平均有3000个突触。比OpenAI的GPT3大三个数量级，一千倍。（附：GPT的参数量可以简单对应到神经元的突触量。）

图4：神经元通过轴突上的突触连接其它神经元。

灵魂/精神意识出现

考古发现，大约5万年前，大量出现坟墓了。而此之前，原始人们并不掩埋同类的尸体，而是弃之荒野。

图5：山顶洞人埋葬死者想象图

1.8万年前的旧石器时代晚期，处于母系氏族社会早期状态的北京周口店山顶洞人已把自己居住的山洞的深处用作公共墓室。其尸体上及周围撒有红色的赤铁矿粉屑。

为什么要做坟墓，并且放点各种陪葬品？是因为原始人有了灵魂意识： “有来世，肉体烂掉了，但是精神还在。”，这就是意识的一个标志。

死亡意识出现

动物是没有死亡意识的，人是一出生，就有死亡意识的。远古人有了死亡意识，没死的时候，就开始给自己挖坟了。

同时死亡意识是推动人类个体发展的关键，也是促进人类不断向前发展的关键：

乔布斯：“每天活成我生命中的最后一天。”
马斯克：“死亡是对人的最好的礼物，这是推陈出新的关键。”

意识这个东西是如何来的呢？大家的猜测：
这三百万年的大脑发展，容积逐渐变大，到了某个临界值，意识就自然涌现了。

文字的出现

距今六千年，在两河流域，苏美尔人出现了楔形文字，也是人类大脑到一定程度，自然涌现的。

图6：楔形文字

对大模型的认知

基于对大脑的认知理解，OpenAI在2020年1月发表了 Scaling Laws for Neural Language Models
https://arxiv.org/abs/2001.08361 这篇经典的论文后，就全力进入百倍的参数量的GTP3的调教了，虽然GPT3被各种吐槽胡说八道，但是随后一系列的版本证明了他们的路线正确性。

参数量不是最关键的一个因素

大模型是正确的路线，但是参数量并不是最关键的一个因素。

微软和英伟达在2020年10月联手发布了5300亿参数的Megatron-Turing自然语言生成模型（MT-NLG）。
2021年1月，谷歌推出的Switch Transformer模型以高达1.6万亿的参数量打破了GPT-3作为最大AI模型的统治地位，成为史上首个万亿级语言模型。
2021年，11月，阿里达摩院大模型M6突破10万亿参数。
2021年，12月，谷歌还提出了1.2万亿参数的通用稀疏语言模型GLaM，在7项小样本学习领域的性能超过GPT-3。

但是这些大家都很少听说，都不如ChatGPT，更不如GPT-4，显然参数量并不是唯一因素。

在动物届，也有神经元比人类多的。

非洲象的大脑重约5千克，含有2570亿个神经元，远超人脑（约1.4千克，约860亿个神经元）。
海豚大脑皮质的神经元细胞为180亿个，比人类的130亿个还要多。

图7：比人类神经元多的动物

无限猴子实验

认知科学的有个“无限猴子实验”，

如果有无数多的猴子，前提是它们都会熟练地使用打印机，将它们安排着使用无数的打印机上随机打字，并且持续着无限长的时间。

那么在某一个时间点，它们一定可以打出莎士比亚的全部著作。

图8：来自百度文心一言的画，关键字是一只猴子坐在打印机前，打字。

理论上讲，给它无限的时间，是可以敲出来的。
但是这个时间从宇宙大爆炸开始到宇宙消亡，这么长的时间也是不够的，这是个组合爆照的问题。

假设要写的著作有20万个字母；

每一敲下，可能是26个英文字符+一些空格或标点符号，假设有30种可能。

这样组合有 {30}^{200000} 种可能，大致是\({10}^{295424}\)，这是一个极其巨大的数，它有295425位数字。

而整个宇宙中约有 \(10^{80}\) 个粒子，其中大约有 \(10^{68}\) 个原子。

也就是说我们语言文字的组合，绝大多数是没有任何意义和价值的。但是很奇怪的是，当我们人说话或写作时，都是能听懂的，都是有意义的。

认知科学，或者脑科学里面有这样说法：