你可能了解 DNS 协议是什么?那你了解 DNS 完整查询过程是什么吗?它底层是基于 TCP 还是 UDP 喃?TCP 与 UDP 又各自负责 DNS 的哪些部分喃?
本文就从以下几个方面循序渐进走进 DNS 协议、它的完整查询过程以及底层是基于 UDP 还是 TCP 实现?
DNS(Domain Name System:域名系统),与 HTTP、FTP 和 SMTP 一样,DNS 协议也是应用层的协议,用于将用户提供的主机名(域名)解析为 IP 地址。
简单来说,DNS 就像是一个自动的电话号码簿,我们可以直接拨打 47.105.127.0 呼叫对方,但这不方便记录、记忆,DNS 提供一种手段能够让我们直接拨打对方的域名 www.pzijun.cn 找到对方
就是将域名 www.baidu.com 解析成 ip地址:1.1.1.1 ,思考一下
DNS 的核心系统是一个三层的树状、分布式服务,基本对应域名的结构:
有了这个系统后,任何域名都可以在上面这个结构中进行从上到下查询,例如,你要访问“www.pzijun.cn”,就要进行下面的三次查询:
但如果全世界的域名解析都往这个系统里挤,这个系统可能被挤瘫痪了,即使不瘫痪,解析速度也会大打折扣,所以 DNS 采取了一种非常有效的手段来解决这个问题: 缓存
域名缓存有以下两种方式:
/etc/hosts
,在 Windows 里是 C:\WINDOWS\system32\drivers\etc\hosts
,如果操作系统在缓存里找不到 DNS 记录,就会找这个文件DNS 查询有两种方式:递归 和 迭代 。
一般来说,DNS 客户端设置使用的 DNS 服务器一般都是 递归服务器 ,它负责全权处理客户端的 DNS 查询请求,直到返回最终结果
而 DNS 根域名服务器之间一般采用 迭代查询 方式,以免根域名服务器的压力过大
将我们上面所说的域名服务器之间的 DNS 查询请求过程和域名缓存结合起来,完整查询过程:
5 . 本地域名服务器 将得到的 IP 地址返回给操作系统,同时自己将 IP 地址 缓存 起来 6 . 操作系统 将 IP 地址返回给浏览器,同时自己也将 IP 地址 缓存 起来 7 . 至此, 浏览器 就得到了域名对应的 IP 地址,并将 IP 地址 缓存 起来
这些远程查询都是基于UDP协议,通常使用 53 号端口。
衡量计算机通信快慢的指标是 响应时间 ,即从用户发出通信指令(输入网址敲回车键)开始,到用户看到完整页面为止,所花费的时间。即:
响应时间 = DNS域名解析时间 + TCP 连接建立时间 + HTTP交易时间
其中,TCP 连接建立需要三次挥手,HTTP交易一来一回,都不可能减少(具体计算过程可见 说一下HTTP/3新特性,为什么选择使用UDP协议? ),所以只能让DNS域名解析的时间越小越好
如果 DNS 查询继续采用 TCP 连接?TCP 作为可靠的传输协议,TCP 建立连接会带来以下的额外开销:
假设网络通信所消耗的时间是可以忽略的不计的,如果我们只考虑 TCP 建立连接时传输的数据的话,可以简单来算一笔账:
使用 TCP 协议(共 330 字节):
需要注意的是,我们在这里计算结果的前提是 DNS 解析器只需要与一个命名服务器或者权威服务器进行通信就可以获得 DNS 响应,但是在实际场景中,DNS 解析器可能会递归地与多个命名服务器进行通信,这也加倍地放大了 TCP 协议在额外开销上的劣势。
如果使用 UDP 协议(共 84 字节)
如果 DNS 查询的请求体和响应分别是 15 和 70 字节,那么 TCP 相比于 UDP 协议会增加 ~250 字节和 ~145% 的额外开销
所以当请求体和响应的大小比较小时,通过 TCP 协议进行传输不仅需要传输更多的数据,还会消耗更多的资源,多次通信以及信息传输带来的时间成本在 DNS 查询较小时是无法被忽视的,TCP 连接带来的可靠性在 DNS 的场景中没能发挥太大的作用。
由于历史的原因,互联网上物理链路的最小 MTU = 576 ,基于 UDP 传输的 DNS 为了限制报文不超过 576 ,所以将 DNS 报文限制在 512 字节。
这样一旦 DNS 查询应答超过 512 字节,基于 UDP 的 DNS 就只有截短为 512 字节,那么用户得到的 DNS 应答就是不完整的。
为了克服这种困难,我们第一次在 DNS 协议中明确了 『当 DNS 查询被截断时,应该使用 TCP 协议进行重试』 这一规范。尽管交易时间可能比较长,但毕竟可以得到完整的答案,总比得到不完整的答案要好。
同时,当数据包足够大的时候,TCP 三次握手带来的额外开销比例就会越来越小,与整个包的大小相比就会趋近于 0:
RFC6891 中引入了 EDNS 机制,它允许我们使用 UDP 最多传输 4096 字节的数据,但是由于 MTU 的限制导致的传输数据分片以及丢失(在实际生产中,一旦数据包中的数据超过了传送链路的最大传输单元MTU,当前数据包就可能会被分片传输、丢弃),使得这一特性不够可靠;
需要注意的是,DNS 使用了 UDP 协议来获取域名对应的 IP 地址,这个没错,但有些片面,准确的来说,DNS 查询在刚设计时主要使用 UDP 协议进行通信,而 TCP 协议也是在 DNS 的演进和发展中被加入到规范的:
Copyright© 2013-2020
All Rights Reserved 京ICP备2023019179号-8