差评一个二维码能装10T电影?看样子我都能改变世界了( 二 )
本文插图
这样一套操作逻辑就叫做字典编码算法 , 所谓的翻译对照表也就是算法中的「 字典 」 , 不论是什么压缩算法 , 都得带着这本「 字典 」 , 也就是解码参数 。
当然聪明的你可能已经发现了 , 这本字典完全可以换个方式写:我们还可以将字符串分解成 abc abc acca bd acca bd, 就又得到了一种全新的压缩方式 。
不同的压缩方式对应不同的文件格式 , 我们常见的有 rar/zip/7z 等等 , 其实就是在告诉电脑这是用什么方式压缩的 。
而相应的的翻译工具 , 则就是常见的压缩软件 , 相信不少人都被这张图骚扰过
本文插图
理论上来说 , 我们可以搞一波智障操作 , 这么写翻译表:abcabcaacabdaacabd = 1, 整个字符串只用一个数字就能代替了 。
但这么干的话 , 字典本身的大小就和原文一样了 , 再加上压缩后的数字 , 信息量反倒变大了 。
换成现实比方 , 就意味着你把一个 1 KB 的文件反向压缩成了一个 1.1 KB 的玩意儿 , 所以说这是波智障操作 。。。
所以说这事儿挺不简单的 , 目前为止工程师们研究出了很多方法 , 最快的压缩效率也只是接近 2 : 1。
本文插图
所以才说开头那个万亿分之一的消息惊得让我摔在了地上 。
事实上 , 工程师怎么实现是一回事 , 压缩的极限比例其实能用数学工具算出来 。
这就不得不提到一位天降猛男 , 信息论之父——克劳德 · 香农 。
本文插图
作为一个伟大的科学家 , 克劳德 · 香农提出了信息熵函数 , 而在后续学者的配合下 , 终结了这个疑问 。
信息熵公式▼
总而言之 , 在这个宇宙里 , 信息压缩的比例是存在理论上限的 , 和信息的复杂程度有关 , 但是远远达不到万亿分之一 , 这个专利要真能达到万亿分之一 , 香农的棺材板都要压不住了 。。。
所以关于这篇专利的说法是真的吗?为了求证 , 我去查看了一下专利的原始文档 。
【差评一个二维码能装10T电影?看样子我都能改变世界了】果然 , 在文章并没有与万亿级相关的字眼和描述 , 取而代之的则是千分之一和万分之一的描述 。
所以 。。。 又是一场营销号折腾出来的闹剧吗?
也不是 , 尽管在文章中没有提到万亿级压缩 , 但是申请者对自己的专利也是信心满满:理论上任何数据都可以压缩到只剩 2 个比特和解码参数 。
还记得前面提到的智障操作吗? 。。。 压缩到 2 个比特情况下没提解码参数有多大 , 这不耍流氓么?
而且就算不谈万亿级别的压缩率 , 仅仅是万分之一的压缩率可以实现吗?
可以 , 很简单 , 但没有任何意义:
假设我有个由 100 万个 a 组成的字符串 , 那我就只需要用「 100 万个 a 」这句话 , 就完成了这波极限操作 。
说白了 , 这都是重复信息 , 原有信息那 100 万个 a 看着长 , 根本就不包含有意义的内容 。
还记得差评君以前介绍过的压缩炸弹吗?一个 42 KB 文件通过自我复制 N 遍达到 4.5 PB, 这玩意儿就是压缩比高得吓人 , 但一点卵用都没 。
本文插图
总之 , 这个还在申请中的专利绝对不可能有网传万亿分之一的压缩比那么夸张 , 专利文件里写到的「 任何数据都可以压缩到只剩 2 个比特和解码参数 」也多半是没有实际意义的极端情况 。
话说回来 , 这玩意儿要真推翻香农的定理或者是打了我的脸 , 那差评君高兴还来不及呢:人类的信息科学一直都在解决信息处理和传递问题 , 要是真那么牛逼 , 那我们飞出太阳系指日可待 。
推荐阅读
- 一个曾默默无闻的贫困县,在丹寨的许多村寨,贫困县丹寨为啥摇身一变成度假天堂
- 他们的努力会得到上级的认可,事业扶摇直上,射手座的运气也有了一个很好的上升机会
- 琉璃翡翠|国防部长公开“背叛”,撤走一个宪兵营,特朗普下令军队平息骚乱
- Angelababy|《跑男》不敢请的明星,一个是因为郑恺,还有两个都是因为杨颖!
- 野史来探究|《胜算》看的一头雾水?唐飞是下一个程婴,背叛后开启反间计划
- 戴小青说趣事|晃我一个跟头,搞笑GIF:新娘太坏了
- 葛梦茹说娱乐|搞笑GIF:这地方到底有什么?竟然是一个危险的地方!
- 农加贵|他19岁成麻风村第一任教师 34年间一个人撑起一座学校
- 公安部网安局|| “杀猪盘”——江湖上一个必须知道的词,网警漫画
- 利率|最后一个月!这次重要的二选一,将决定你以后房贷要还多少钱