数学之美札记:文字和语言 vs 数字和信息

     数学、文字和天然语言同样,都是信息的载体,他们之间有着自然的联系。语言和数学的产生都是为了同同样目的——记录和传播信息。本文是《数学之美》第一章札记。    安全

     1798年,拿破仑远征军中,皮埃尔●弗朗索瓦布沙尔中尉在一个叫罗塞塔的地方发现了一块破碎的古埃及石碑,上面有三种语言:埃及象形文字、埃及的拼音文字和古希腊文,这就是著名的罗塞塔(Rosetta)石碑。 
编码

    1822年,法国语言学家商博良破解了罗塞塔石碑上的古埃及象形文字。随着罗塞塔石碑的破译,帮助咱们了解了整个古埃及的历史和文明,这要归功于埃及人经过三种语言进行了记录,这件事有两点指导意义:spa

  1. 信息的冗余是信息安全的保障。罗塞塔石碑上的内容是同一信息重复三次,所以只要有一分内容无缺保留下来,原有的信息就不会丢失,这对信道编码有指导意义。翻译

  2. 语言的数据,即语料,尤为是双语或者多语的对照语料对翻译相当重要,它是咱们从事机器翻译研究的基础。orm

    计数系统的产生轶闻:美籍俄裔物理学家乔治● 伽莫夫在《从一到无穷大》一书中讲了这样一个原始部落中的故事。两个酋长要比一比谁说的数字大,一个酋长想了想,先说了“三”,第二个酋长想了半天,说你 赢了。由于在原始部落,物质极其缺少,超过三的时候不多,他们称之为“许多”或者叫数不清。当咱们的祖先须要记录的物件超过三时,当他们以为五和八仍是有 区别的时候,计数系统就产生了。数学

    数字是计数系统的基础。早起的数字并无书写的形式,而是掰指头,这就是咱们今天使用十进制的缘由。毫无疑问,若是咱们有十二个指头,今天咱们用的必定是 十二进制。渐渐的,咱们的祖先发现十个指头不够用了。虽然最简单的办法就是把十个脚趾头也算上,可是这不能解决根本问题。基础

    咱们的祖先发明了进位制,也就是今天所说的逢十进一。这是人类在科学上的重大飞跃。几乎全部的文明都采用了十进制,但玛雅文明除外,他们数完了所有的手指 和脚趾才开始进位,也就是使用了二十进制。玛雅人的一个世纪,他们称为太阳纪,是四百年。2012年正好是目前这个太阳纪的最后一年,2013年将是新的 太阳纪的开始,这也就是所谓的2012世界末日。原理

    对于不一样位数数字的表示,中国人和罗马人都用明确的单位来表示数字的不一样量级,中国人用个十百千万亿兆。罗马人用Ⅰ表明个,Ⅴ表明5,Ⅹ表明10,L表明50, C表明100, D表明500, M表明1000。二进制

    这两种表示法都不自觉的引入了朴素的编码的概念。首先,他们都是用不一样的符号表明不一样的数学概念;第二,他们分别制定了解码的规则,在中国,解码的规则是 乘法,在罗马,解码的规则是加减法——小数字出如今大数字左边为减,右边为加。从编码的有效性来说,中国人的作法币罗马人高明。信息安全

    描述数字最有效的是古印度人,他们发明了包括0在内的10个阿拉伯数字,这种表示方法比中国和罗马的都抽象,可是使用方便,它们由阿拉伯人传入欧洲并获得普及。

    古犹太人在要求抄写《圣经》时,为了不抄写错误,发明了一种相似于咱们今天计算机和通讯中校验码的方法。他们把没一个希伯来字母对应于一个数字,这样每 行文字加起来便获得一个特殊的数字,这个数字便成为了这一行的校验码。一样,对于每一列也是这样处理。当犹太学者抄完一页《圣经》时,他们须要把每一行的 文字加起来,看看新的校验码是否和原文的相同,而后对每一页进行一样的处理。这背后的原理和咱们今天的各类校验是相同的。

相关文章
相关标签/搜索