信息是不确定性的分辨率

时间:2023-11-20 06:59:01

郦安治(Andrew Lih):美国南加州大学新闻学副教授,著有《维基百科的革命》(The Wikipedia Revolution: How a Bunch of Nobodies Created the World's Greatest Encyclopedia)。

信息是不确定性的分辨率

我们在数字时代所享受的万物,都取决于这个思想,但鲜有人知晓这个至简、至雅信息理论的基础及其创始人。有多少人明白,如今的信息时代并非出自比尔·盖茨或史蒂夫·乔布斯之手,而是由克劳德·香农(Claude Shannon)于1948年创建而成。香农为人谦逊低调却又智力超群,不喜抛头露面发表演讲或接受采访。这位伟大的数学家、遗传学家和密码专家,在战争中充斥的不仅仅是子弹与铁炮的第二次世界大战后,创建了信息理论。

如果第一次世界大战是第一场机械化战争,那么第二次世界大战就是第一场基于通信技术的角力。与以往的冲突纷争不同,各方军事力量均高度利用了无线电通信方式。这种快速的远程协作将战争推向了世界的各个角落。密码学领域在其中得以迅猛发展,以此确保信息的隐秘性不被对手发现。与此同时,在战争史上,雷达第一次被运用在侦查和追踪飞机上,从而超越了以往在地平线尽头就结束的视觉能力。

那时克劳德·香农正着手处理防空目标的定位,并设计直接与雷达相连的火控系统。如何可以确定敌人飞机当前和未来的位置,并以此校准开火时间将敌机击落呢?获取关于飞机位置的雷达信息是一大突破,但相当麻烦,因为它只能提供近似的位置,无法精确到能立即使用。战争结束后,这激发了香农和许多其他人思考滤波的本质和信息传播的动力,包括雷达信号、声音(电话)、视频(电视)。噪音是通信的大敌,所以任何去除杂音进行存储和传递信息的方法,对香农当时的雇主——贝尔实验室,20世纪中期美国电话行业垄断的研究机构而言,都有着特殊的意义。

香农视通信为工程科学最具数学特性的学科,于是他转而开始进行这方面的研究。在麻省理工学院学习的早期,香农研究了万尼瓦尔·布什(Vannevar Bush)那繁复难懂的微分分析类比计算机,并发表了一篇有着大量数学运算的博士论文《理论遗传学的代数》(An Algebra for Theoretical Genetics),香农综合了各种学科的知识,在理解信息处理的基本原则方面,香农游刃有余。在1948年,香农发布了最重要的核心论点,该论点短小而精悍:信息学是不确定性的分辨率。

只要能解决不确定性并将其传递,这就是信息的本质。尽管这听起来平淡无奇,但至关重要的一点是,其让人察觉到一个问题:由于人类的语言五花八门,一种说话方式可能对一些人有意义,而对其他人而言则不知所云。直到香农的理论形成之后,人们才知道该如何恰如其分地补偿这种“心理因素”。基于同事拉尔夫·哈特利(Ralph Hartley)和哈里·尼奎斯特(Harry Nyquist)的成果,香农指出,编码和符号是解决两个沟通者是否对不确定性有相同理解的关键所在。

香农提问道:“什么是最为简洁的不确定性分辨率?”对他而言,这如同掷硬币,结果就是正面或反面,是或不是,只可能有两个结果。香农的结论是,任何类型的信息都可被编码为一系列“是或否”的答案。今天我们所知道的这些问题的答案,就是数字信息的比特1和0,其组成了电子邮件、数码相片、音乐光盘或是高清视频的一切信息。所有的信息都可以被表示及编码为离散的比特,不只是近似而是完全相同,没有任何的杂音或误差,这个突破让香农在学术界和贝尔实验室的同行们惊诧万分,之前他们已经深陷绝望,毫无信心去创建信息学那简单而普遍的理论。

CD光盘,对广大消费者而言,是第一个普及的数位编码系统,也借此在1982年将香农理论的遗产带给了普罗大众。通过把每秒钟的音乐乐波分为44 100段(取样),使声音完美再现,并将每段乐波的高度记录成数位数字(量化)。更高的取样率和更精细的量化度,提升了声音的品质。利用现代电路将这些数位转化成类比的声音,就能够保证高保真度。类似的数位方法已经用于图像和视频上,于是今天我们可以尽情享受MP3、DVD和高画质电视,并且可以进行存储、传播并复制高画质光碟压缩(AVCHD)多媒体档案,而不会有任何的品质损失。

香农作为麻省理工学院的教授,他的学生们在信息时代也做出了若干重大突破,包括数据调制解调器、计算机成像、数据压缩、人工智能和数位无线通信等。信息理论作为一种崭新的并且在过去无法想象的发现,几乎影响了我们日常生活的每个角落,包括我们的工作、生活和社交,都成了数字化。信息理论是美妙而优雅的,并且威力十足!