手机流量的本质到底是什么?看完就不再会用超了!( 二 )


手机流量的本质到底是什么?看完就不再会用超了!

文章插图
克劳德·香农
在经典信息论框架内,一切都逃不出香农定理的范围 。信息理论的大厦已经建成,后人只能在工程应用上努力 。当其他人还在拼尽全力爬山的时候,香农已在山顶欣赏美景 。
克劳德·香农于1916年出生于美国,是爱迪生的远房亲戚 。他于1940年获得麻省理工学院数学博士学位,随后加入贝尔实验室数学部 。
在1948年和1949年,香农发表了《通信的数学原理》和《噪声下的通信》这两篇具有深远影响的论文 。
在这两篇论文中,香农阐明了通信的基本问题,给出了通信系统的模型,提出了信息量的数学表达式,并解决了信道容量、编码等一系列基本技术问题,成为了信息论的奠基性著作 。
那么,香农是怎样解释信息的呢?
首先,信息蕴藏于的不确定性之中 。试想,在美剧《权力的游戏中》,保护布兰的阿多只会说一个词:“阿多!”,任何跟他的交流,只会得到一声“阿多!”,不会有任何变化 。因此这里面没有任何不确定性,也就不传递任何信息 。
手机流量的本质到底是什么?看完就不再会用超了!

文章插图
美剧《权力的游戏》中的阿多,只会说:Hodor这一个词
然后,所有不确定的事物都有其发生的概率,信息是这些概率之和(这是简化说法,精确描述需要用到后面的公式) 。
以抛硬币这个最为简单的随机事件为例,如果是正面向上,标记为0,反之如果是反面向上,则标记为1 。
仅通过常识即可得出,0和1的概率都为二分之一(0.5),它们的概率之和就是1 。于是,香农称:这个事件里面蕴含的信息量是1比特 。
注意,大家耳熟能详的“比特”这个概念就此出场!这个词是香农首创的,英文全称是“Binary digit”,缩写为bit,也就是“二进制数字”的意思 。
为什么是二进制呢?因为它最简单,只含0和1这两个数字,就像硬币的正反面一样,表达了像抛硬币这样的宇宙最基本的事件 。
而更复杂的事情,都可以用大量这种简单的事件来叠加表示 。
香农甚至创造出了一个公式来度量信息的多少:
手机流量的本质到底是什么?看完就不再会用超了!

文章插图
香农的信息熵公式
上面的公式过于复杂,本文不进行详细解释具体的计算过程 。
据此公式可以计算出,一个英文字母含有的信息量是4.7比特 。也就是说,采用5个二进制数字,就可以表示所有的英文字母 。
这是显而易见的,因为5个二进制数字共有32种组合,而英文字母共有26个 。
通过上面这个公式,香农把热力学中的“熵”这个概念引入了通信系统,称之为“信息熵” 。
那么,到底什么是熵呢?
初中物理老师教导我们:物质是由分子组成的,这些分子无时无刻不在进行着杂乱无章的随机运动,温度越高,运动也就越激烈,物体将会从固体融化为液体,直至沸腾为气体 。
手机流量的本质到底是什么?看完就不再会用超了!

文章插图
温度,分子运动与熵
假如我们把一滴墨汁滴入水中,由于分子的相互运动和碰撞,就会看到黑色迅速地弥散开来,直到整个液体都被染成黑色为止 。
手机流量的本质到底是什么?看完就不再会用超了!

文章插图
【手机流量的本质到底是什么?看完就不再会用超了!】拿铁咖啡中的熵
从泾渭分明到一片混沌,就是一个混乱程度不断增加的过程,而且这个过程是不可逆的 。
想象一下,你无论怎样摇动那瓶被墨汁染黑的水,也无法让它恢复到最初清水和墨汁界限分明的状态 。
“熵”这个概念正是用来表征一个系统的混乱程度的 。
香农无疑是从中得到了灵感:既然信息蕴含在充满不确定性和出人预料的混乱当中,那么也就可以用“熵”这个概念来衡量 。
于是他把上述自己定义的公式成为“信息熵”,传递信息的符号的不确定越高,计算所得的熵就越大,蕴含的信息就越多 。
这个信息熵的结果,就是用二进制数字:“比特”来表达的 。
与此同是,另外一位顶级科学家,同时也是人工智能的开山祖师:阿兰·图灵在苦思冥想自己的计算设备,该设备只是在头脑中构思的,后来被称作图灵机 。
手机流量的本质到底是什么?看完就不再会用超了!


推荐阅读