全方位认识DNS

对于 DNS(Domain Name System) 大家肯定不陌生,不就是用来将一个网站的域名转换为对应的IP吗 。当我们发现可以上QQ但不能浏览网页时,我们会想到可能是域名服务器挂掉了;当我们用别人提供的hosts文件浏览到一个"不存在"的网页时,我们会了解到域名解析系统的脆弱 。
然而关于DNS还有一大堆故事值得我们去倾听,去思考 。
DNS源起
要想访问网络上的一台计算机,我们必须要知道它的IP地址,但是这些地址(比如243.185.187.39)只是一串数字,没有规律,因此我们很难记住 。并且如果一台计算机变更IP后,它必须通知所有的人 。
显然,直接使用IP地址是一个愚蠢的方案 。于是人们想出了一个替代的方法,即为每一台计算机起一个名字,然后建立计算机名字到地址的一个映射关系 。我们访问计算机的名字,剩下的名字到地址的转换过程则由计算机自动完成 。
早期,名字到地址的转换过程十分简单 。每台计算机保存一个hosts文件,里面列出所有计算机名字和对应的IP地址,然后定期从一个维护此文件的站点更新里面的记录 。当我们访问某个计算机名字时,先在hosts文件找到对应的IP,然后就可以建立连接 。
 
 

全方位认识DNS

文章插图
 
 
hosts 管理主机
 
早期的ARPANET就是这样做的,但是随着网络规模的扩大,这种方法渐渐吃不消了 。主要有以下三个原因:
1:hosts文件变得非常大;
2:主机名字会冲突;
3:集中的维护站点会不堪重负(需要给几百万机器提供hosts文件,想想就可怕) 。
为了解决上面的问题,1983年Paul Mockapetris提出了域名系统(DNS, Domain Name System),这是一种层次的、基于域的命名方案,并且用一个分布式数据库系统加以实现 。当我们需要访问一个域名(其实就是前面说的计算机的名字)时,应用程序会向DNS服务器发起一个DNS请求,DNS服务器返回该域名对应的IP地址 。通过下面三种手段解决了上面的问题:
1:用户计算机上并没有存储所有的名字到IP的映射,这样避免了hosts文件过于庞大(现在各操作系统中hosts文件默认都是空的) 。
2:规定了域名的命名规则,保证主机名字不会重复 。
3:DNS服务器不再是单一的一台机器,而是一个层次的、合理组织的服务器集群 。
这样访问一个域名的过程可以简化为下图:
 
全方位认识DNS

文章插图
 
 
 
域名hosts解析过程
 
DNS协议
那么如何具体实现这个所谓的域名系统呢,要知道管理一个超大型并且不断变化的域名到IP的映射集合可不是一个简单的事,况且还要去应付成千上万的DNS查询请求 。人们最终想出了一套不错的协议,规定如何来实现这个系统,下面我们一起来看看吧 。
首先我们需要制定一套命名规则,防止域名出现重复 。DNS关于域名的规则和我们生活中的快递系统类似,使用层次的地址结构 。快递系统中要给某人邮寄物品,地址可能是这样:中国、广东省、广州市、番禺区、中山西路12号 XXX 。而一个域名看起来则是这样的groups.google.com(为什么不是com.google.groups?我猜可能和老外写地址的习惯有关) 。
对于Internet来说,域名层次结构的顶级(相当于国际快递地址中的国家部分)由ICANN(互联网名称与数字地址分配机构)负责管理 。目前,已经有超过250个顶级域名,每个顶级域名可以进一步划为一些子域(二级域名),这些子域可被再次划分(三级域名),依此类推 。所有这些域名可以组织成一棵树,如下图所示(图片来自Computer Networks: 7-1 ):
 
全方位认识DNS

文章插图
 
 
域名空间树
DNS设计之初是用来建立域名到IP地址的映射,理论上对于每一个域名我们只需要在域名服务器上保存一条记录即可 。这里的记录一般叫作域名资源记录,它是一个五元组,可以用以下格式表示:
 
Domain_name Time_to_live Class Type Value其中:
Domain_name:指出这条记录适用于哪个域名;
Time_to_live:用来表明记录的生存周期,也就是说最多可以缓存该记录多长时间(后面会讲到缓存机制);
Class:一般总是IN;
Type:记录的类型;
Value:记录的值,如果是A记录,则value是一个IPv4地址 。


推荐阅读