Day1 网络世界入门:从打开浏览器到数据抵达的全过程

Day1 网络世界入门:从打开浏览器到数据抵达的全过程

精选文章moguli202025-03-28 13:47:5914A+A-

在当今数字化时代,网络已成为我们生活中不可或缺的一部分。每天,我们无数次打开浏览器,输入网址,瞬间就能获取到来自世界各地的信息。但你是否想过,从我们在浏览器中敲下网址的那一刻,到数据最终呈现在屏幕上,这背后究竟经历了怎样的过程?今天,就让我们一起揭开网络世界神秘的面纱,深入了解从打开浏览器到数据抵达的全过程。

输入网址:一切的开始

当我们在浏览器的地址栏中输入网址,比如 “www.baidu.com”,这一简单的操作其实开启了一段复杂的旅程。网址,专业术语称为 URL(统一资源定位符),它就像是网络世界的门牌号。以 “https://www.baidu.com/s?wd=网络知识” 为例,“https” 是协议,告诉浏览器使用何种方式与服务器通信;“www.baidu.com” 是域名,对应着服务器的地址;“s” 是路径,指示服务器上的具体资源位置;“wd = 网络知识” 则是参数,用于向服务器传递我们的搜索需求等信息。

在输入网址后,浏览器首先要做的是将域名转换为对应的 IP 地址。因为在网络中,计算机之间是通过 IP 地址来相互识别和通信的。这就需要借助 DNS(域名系统),它如同网络世界的电话簿。当浏览器发现本地缓存中没有该域名对应的 IP 地址时,就会向本地 DNS 服务器发送查询请求。本地 DNS 服务器若在自己的缓存中也未找到匹配项,便会向上级 DNS 服务器,如根域名服务器、顶级域名服务器等发起查询,直至找到该域名对应的 IP 地址,然后将其返回给浏览器。[此处插入一张 DNS 查询流程的示意图,例如从本地 DNS 到根域名服务器、顶级域名服务器再到权威域名服务器的查询路径图]

建立连接:数据传输的桥梁

获取到 IP 地址后,浏览器需要与目标服务器建立连接。最常用的连接方式是基于 TCP(传输控制协议)的三次握手。第一次握手,浏览器(客户端)向服务器发送一个带有 SYN(同步序列号)标志的数据包,告诉服务器自己想要建立连接,并随机生成一个初始序列号 seq=x。此时,客户端进入 SYN_SENT 状态。第二次握手,服务器收到客户端的请求后,会返回一个带有 SYN 和 ACK(确认)标志的数据包。其中,SYN 标志用于同步服务器的序列号,假设为 seq=y,ACK 标志则用于确认收到客户端的请求,确认号 ack=x+1。此时,服务器进入 SYN_RCVD 状态。第三次握手,客户端收到服务器的响应后,再发送一个带有 ACK 标志的数据包,确认号 ack=y+1,告诉服务器自己已收到服务器的确认信息。至此,双方成功建立起可靠的 TCP 连接,进入 ESTABLISHED 状态,为数据传输做好了准备。[插入一张 TCP 三次握手的动态示意图,清晰展示三次握手过程中数据包的交互]

发送请求:传递用户的需求

连接建立后,浏览器会根据我们输入的网址和操作,构建 HTTP(超文本传输协议)请求报文。如果是普通的网页访问,可能是一个 GET 请求,请求报文中会包含我们请求的资源路径等信息。例如,我们访问百度首页,请求报文大致如下:

GET / HTTP/1.1

Host: www.baidu.com

User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36

Accept: text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.9

Accept-Encoding: gzip, deflate, br

Accept-Language: zh-CN,zh;q=0.9

在这个请求报文中,“GET” 表示请求方法,“/” 是请求的资源路径,“HTTP/1.1” 是协议版本。“Host” 字段指定了目标服务器的域名,“User-Agent” 字段描述了客户端的信息,如浏览器类型、操作系统等,这些信息有助于服务器返回适合客户端显示的内容。“Accept” 系列字段则告诉服务器客户端支持的响应内容类型、编码方式和语言等。

浏览器将构建好的 HTTP 请求报文交给传输层,传输层会在其基础上添加 TCP 头部,然后再交给网络层添加 IP 头部,最终形成一个完整的数据包,准备在网络中传输。

数据传输:穿越复杂的网络

数据包从我们的计算机出发,首先会经过本地网络,如家庭或办公室的路由器。路由器就像是网络中的交通枢纽,它会根据数据包的目标 IP 地址,在自己的路由表中查找最佳的转发路径。例如,如果目标 IP 地址属于外网,路由器会将数据包转发到与外网连接的接口。在这个过程中,还会涉及到 ARP(地址解析协议),它负责将目标 IP 地址解析为对应的 MAC(媒体访问控制)地址,因为在局域网内,数据是通过 MAC 地址来进行传输的。[插入一张局域网内数据传输,从计算机到路由器,涉及 ARP 解析的示意图]

数据包离开本地网络后,会在互联网的骨干网络中穿梭。这期间,它可能会经过多个路由器、交换机等网络设备。每个设备都会根据自己的规则和配置,对数据包进行转发、路由等处理,就像接力赛一样,将数据包一步步传向目标服务器所在的网络。在传输过程中,为了确保数据的完整性和可靠性,TCP 协议会对数据包进行编号和确认。如果某个数据包在传输过程中丢失或损坏,接收方会要求发送方重新发送。

服务器响应:提供所需的数据

当数据包最终抵达目标服务器时,服务器会首先检查 IP 头部和 TCP 头部,确认数据包的来源和完整性。然后,将 TCP 头部和 IP 头部剥离,提取出 HTTP 请求报文,交给服务器上运行的 Web 服务程序进行处理。例如,对于百度服务器来说,它会根据请求报文中的路径和参数,如 “/s?wd = 网络知识”,在自己的数据库中查找相关的网页内容和搜索结果。

服务器根据请求生成 HTTP 响应报文,响应报文的格式与请求报文类似,同样包含状态行、头部和正文。例如,一个成功的响应报文可能如下:

HTTP/1.1 200 OK

Content-Type: text/html; charset=utf-8

Content-Length: 12345

Server: Apache/2.4.41 (Ubuntu)

Date: Sun, 16 Aug 2020 10:20:30 GMT

Last-Modified: Sat, 15 Aug 2020 15:30:00 GMT

Cache-Control: max-age=3600

Expires: Sun, 16 Aug 2020 11:20:30 GMT

百度搜索结果

...

...

在这个响应报文中,“HTTP/1.1 200 OK” 是状态行,表示请求成功,“200” 是状态码。“Content-Type” 字段指定了响应内容的类型为 HTML,字符编码为 UTF-8。“Content-Length” 字段告诉客户端响应正文的长度。服务器还会在头部添加一些其他信息,如服务器软件类型、日期、缓存控制等。然后,服务器将响应报文通过网络原路返回给客户端。

接收数据:呈现精彩的内容

客户端(浏览器)接收到服务器返回的响应数据包后,同样会先经过网络层和传输层的处理,剥离 IP 头部和 TCP 头部,提取出 HTTP 响应报文。浏览器会根据响应报文中的内容类型,如 HTML、CSS、JavaScript、图片等,进行相应的解析和渲染。

对于 HTML 页面,浏览器会按照 HTML 的语法规则,将其解析为文档对象模型(DOM)树。然后,根据 CSS 样式表对 DOM 树中的元素进行样式渲染,确定每个元素在页面中的位置、颜色、字体等外观属性。如果页面中包含 JavaScript 脚本,浏览器会逐行解析和执行脚本,实现页面的交互功能,如动态更新页面内容、响应用户的点击事件等。最后,浏览器将渲染好的页面呈现给我们,我们便看到了期待已久的网页内容。

从打开浏览器到数据抵达,这看似简单的操作背后,蕴含着计算机网络领域众多复杂而精妙的技术和原理。了解这一过程,不仅能让我们更好地理解网络世界的运行机制,也有助于我们在日常使用网络时,更好地排查问题、优化网络体验。在后续的文章中,我们还将深入探讨网络世界的更多奥秘,敬请期待。

点击这里复制本文地址 以上内容由莫古技术网整理呈现,请务必在转载分享时注明本文地址!如对内容有疑问,请联系我们,谢谢!
qrcode

莫古技术网 © All Rights Reserved.  滇ICP备2024046894号-2