reading-notes

张俊的读书笔记

View project on GitHub

cover

作者: 凯萨·伊达尔戈
出版社: 中信出版集团股份有限公司
副标题: 秩序的进化,从原子到经济
出版年: 2015-11-1
页数: 278
定价: CNY 49.00
装帧: 平装
ISBN: 9787508654829

豆瓣链接

第一部分 原子中的比特

第二章 无意义的实体

一个智利人买了一辆世界上最贵的汽车:一辆标价超过250万美元的布加迪威龙。一辆普通的现代汽车每公斤价值在10美元左右,一辆顶级的M6宝马汽车每公斤价值在60美元左右。可见,即使布加迪威龙没有黄金昂贵,但是却远远超过了白银的价格,而一辆现代汽车的价格至少和铜相当。

作为一辆汽车,它的价值在撞上墙的一刹那就灰飞烟灭,但它的重量没有改变。那么,为什么车的价值会消散呢?原因并不是车祸破坏了汽车部件的原子结构,而是破坏了部件的排列顺序。随着各个零件分崩离析,布加迪威龙也失去了本身的模样,其中包含的信息在很大程度上都被摧毁了。因而我们说,布加迪威龙250万美元的价值在于零件的组合方式,而不是零件本身。这些组合方式就是信息

根据信息论之父克劳德·香农所说,信息是交流中想要传递特殊消息所需的最小单位。换言之,就是表达一种排列方式所需的最小内存,比如布加迪威龙中原子的排列方式。

那么一条推特里面具体包含了多少信息呢?为了解决这个问题,让我们假想两个使用推特的玩家——艾比和布莱恩。在游戏里,艾比和布莱恩将只能通过“是”或“不是”来猜答对方推特的内容。前提是他们都有一本包含所有可能出现的推特内容的书。游戏的开始,艾比先从书中随机选定一条推特,然后让布莱恩通过提问猜出她的推特内容,不过艾比只能回答“是”或“不是”。香农提出,一条推特体现的信息量等于布莱恩需要完全猜出艾比推特内容所需要的最少问题。那么,最少需要多少个问题呢?

稍微做个简化,假设艾比和布莱恩只能使用32种字符:小写的26个英文字母再加上一些其他的字符,像空格“”、斜线“/”、逗号“,”、句号“。”,以及艾特符号“@”还有井号“#”;并且假设艾比和布莱恩有一张字符和数字相对应的表格(a = 1, b = 2, …, @ = 31, # = 32)。

对于布莱恩来说,最好的提问方式就是每次削减一半的可能字符数,如果他真的这么做,那么第一个问题应该是“第一个字符大于16么?”如果艾比回答不是,那么布莱恩将知道艾比推特的第一个字符在字母“a”与“p”之间,紧接着第二个问题应该是“第一个字符大于8么?”如果艾比回答是,布莱恩将知道艾比推特的第一个字母在字母“i”和“p”之间。很显然,下一个问题将是“第一个字符大于12么?”

每次提问,布莱恩都将猜测范围缩减了一半。由于有32个字符,所以想要完全得知其中一个字符,布莱恩都需要提5个问题。最后,因为一条推特有140个字符,布莱恩将需要提140×5=700个问题——或者我们可以用“比特”来表示这个最小的问题单位——去确定艾比的推特。

香农理论告诉我们,我们最少需要700个比特来表达一条由32个字符写成的推特。

要懂得玻尔兹曼和香农之间对于“熵”的理解差异,假想一个只坐满一半的体育场。注意,我们有无数种方式可以让一个体育场上座率达到一半,通过探索这些不同的方式,我们将解释什么是

首先,假设人们可以在整个球场内自由移动。其中一种坐满半个球场的方式是让大家挨着中心场地落座,空出外围的半数座位;另一种则是坐在外围,空出中心区域的位子。当然,人们也可以随机选择自己的位子。

在解释“熵”之前,我还需要引入两个概念。

  1. 将每种坐满半个体育场的座位分布称为一种“状态”(或者更专业一些,称之为“微态”,即微观状态);
  2. 假设当两种状态的平均座位排号相同时,这两种状态可视为等价。

以体育馆为例,在统计物理学中,“熵”的定义即等价状态在所有可能的状态中所占的比率(严格意义上来说,其实是这个分数的对数,但对于我的论证并无大碍)。所以,熵值在人们全部坐在内圈或者外围时是最低的,因为人们只有一种坐法。而当平均座位排号是最中间的座位排号时,熵值最大,因为存在无数种可能。玻尔兹曼把“熵”定义为某种条件下等价状态的个数,在这个例子中,最大熵值出现在当平均座位排号为中间排号时。

值得一提的是,即便人们通常将熵与混沌、无序相提并论,但实际上熵并不是用来衡量混乱程度的,而是衡量状态的多重性(等价状态的个数),只不过凑巧,无序状态往往多重性较高,因此实际中,高熵值的状态极有可能是无序的。所以,将熵值看作混乱状态的一种衡量方式并非毫无根据。然而,即使混乱程度并没有加深,熵值仍然可以增加,比如气体从一个体积为1的盒子中扩散到体积为2的盒子中(原先例子中的体育馆容量扩大到两倍)。此时,由于在更大的空间内气体的排列方式更多,熵值随着体积的增大而增大,但混乱程度却并没有随之提升。

比起实验性论证,香农更关心生活中通信系统的微态,比如一条推特或一座体育馆的座位,因此,香农使用“信息”来等价于熵值(因此,本书中它们基本是同义词)。想要准确描述一个平均座位排号居中的微态,需要更多比特,因为等价状态太多,所以我们需要更详细和具体的信息来精确定位到某个特定的微态上。所以,香农认为,信息和熵在功能上是等价的:想要具体描述一条特定消息(香农定义下的“信息”)的比特数,即代表了实际上能够传递出的消息数量(即熵,我们称之为状态的多重性)。但切记,信息和熵并不完全是一回事。

事实上,尽管我们要耗费更多比特来表达一个随机的混沌状态,但这并不意味着这些状态中蕴含更多的信息。越多的信息诚然需要更多的比特数,但这并不是事实的全部。以体育场为例,当人们随机挑选座位时,熵值最大但同时也最无序(即使等价状态中的其中一个可能是相当有序的)。事实上,在自然科学的研究领域中,或者大众的认知里,“信息”所代表的一向都不仅限于比特数,还包括对于有序程度的衡量。

为了解释有序状态的特殊性,我将会把玻尔兹曼关于原子的理论引入体育馆的例子中。现在体育馆中仍然只能坐一半的人,但条件是平均座位排号必须是最中间的座位排号。换成物理学,这就相当于要求系统的能量守恒。但即便如此,整个系统仍有许多状态可以使得平均座位排号居中,其中大多都相当随意,少部分则很特殊。如果将坐在体育场的人看作屏幕上的像素,则他们的座位排列可以拼成单词,比如“信息”,或是拼成图画,比如Hello Kitty的脸。

为了确定哪些状态是常见的,我们需要将所有可能的状态归类。方法之一就是寻找不同状态之间的关联性,如果其中一种状态可以简单地变化成为另一种状态,则它们相互关联。让我们简单地假设变形就是指所有人往上下左右相邻的位子上移动一格,使得形成的新的状态仍然满足平均座位排号居中的条件。也就是说,人们可以集体向右平移,或者坐在外围的人向内移一格,同时坐在内圈的人向外移一格。

原则上,简易的变形能够让我们转换到任意一种状态,但这操作起来却并不容易。如果体育馆中的人只能按照相邻法则选择位子(当然,要同时满足排号居中的条件),我们永远不可能突然间转换到一个拼凑成字母或图形的状态,因为这种状态极其少见并且难以达到。这个例子关乎信息是如何体现秩序的:在一个物理系统内,信息是熵的对立面,因为信息通常体现在罕见、规则但不容易得到的状态中。

在这里我们并不是想要寻找所有可能的原子排列,而是寻找产生布加迪威龙的排列方式(就如同用座位拼出一个词一样)。例如,转动布加迪威龙的轮胎并不改变我们所感兴趣的一辆车的基本性质,所以任何轮胎转动方式不同的布加迪威龙都是等价的。完美的布加迪威龙很少,就像人们在体育场中的座位分布,原子的排列方式恰好形成一辆布加迪威龙的可能性很小。但另一方面,布加迪威龙的残骸,就具有很高的多重性(高熵值),同时包含更少的信息(即使表达这种混乱的状态需要更多的比特数)。不过所有状态中的绝大多数,都是“自然状态”下的布加迪威龙,如同人们随机地散坐在体育场里。在这种状态下,布加迪威龙中的铁以铁矿石,铝以铝土矿的形式呈现。布加迪威龙的损坏同时也是信息的损毁;布加迪威龙的生产,在另一方面,是信息的具象化。

比如一个魔方。你大可尝试一下,你是不可能通过偶然还原一个魔方的,因此它实际上完美地证明了还原路径和熵之间的关系。一个魔方有超过4.3×1019种可能的状态(即43 252 003 274 489 856 000),而只有一个是完美的有序状态,而且这个状态并不是那么难以达到,因为我们甚至可以在20步以内将它还原。“20”这个数字听上去很小,但想要找到正确、连续的“20”步并不容易,大多数人在还原的时候都绕了弯路——还原魔方的经典套路(构建顶面的十字架,还原顶面四角,还原中间层等等),通常需要超过50步来完成(直到最近人们仍然认为还原魔方所需的必要步数大于20)。但无论如何,这都说明,或多或少,只有极少可能的罕见还原路径通向一个完美的魔方;这些路径就隐藏在那些让魔方越来越混乱的海量路径之中。所以想要熵值增长,就去把魔方放在孩子的手中。因此,自然界中信息十分罕见,不仅是因为“信息丰富”的状态并不普遍,更是因为非人为条件下,这种状态很难达到。

DNA的大量未知编码说明,即使我们无法解读,信息仍然存在。DNA排列方式并不是想要重新定义“信息”。尽管我们很难了解DNA序列的意义或功能,但我们仍能够检测到DNA中信息的存在。因此,我们不应该混淆信息本身的存在与其含义,或从旁观者的角度寻找信息。人类语言所交流的信息(如英语)以及生物交流所传递的信息(如DNA)之间的关联性在于我们是否知道如何翻译它们。它们代表着这个时代信息资源丰富的特点,不随观察者的改变而改变。这表明,对于“沟通交流”来说,我们需要一个从无意义到有意义的转化:我们向外传递的有意义的信息,是建立在信息本身毫无意义的物理秩序之上的,而这些无意义的物理秩序就是真正的信息本身。

我们把熵的多态性与我们处理信息的能力(分析计算能力)相联系。正如我们在魔方的例子中所看到的,我们很难找到“信息丰富”这样一种状态,这不仅是因为这种状态很罕见,也是因为我们找不到达到这种状态的途径。这也就是为什么我们把一些人成功复原魔方的能力归结于他们的高智商:那些成功复原魔方的人找到了那些罕见的途径(或是找到了发现这些途径的规则)。

第三章 永存的异常