从Url到页面加载的前端知识梳理

之前在掘金上看了一篇文章，名为《从输入URL到页面加载的过程—如何由一道题完善自己的前端知识体系！》感觉对整个前端的流程，包括底层的一些工作原理讲的很系统。并融入了很多计算机网路的常识问题。借着给工作室做一次技术分享的机会，我想把相关的知识自己在整理下。

涉及到的知识

按照文章的整个结构，将整个从Url到页面加载分为以下的几个阶段：

从浏览器接收url到开启网络请求线程（这一部分可以展开浏览器的机制以及进程与线程之间的关系）

开启网络线程到发出一个完整的http请求（这一部分涉及到dns查询，tcp/ip请求，五层因特网协议栈等知识）

从服务器接收到请求到对应后台接收到请求（这一部分可能涉及到负载均衡，安全拦截以及后台内部的处理等等）

后台和前台的http交互（这一部分包括http头部、响应码、报文结构、cookie等知识，可以提下静态资源的cookie优化，以及编码解码，如gzip压缩等）

单独拎出来的缓存问题，http的缓存（这部分包括http缓存头部，etag，catch-control等）

浏览器接收到http数据包后的解析流程（解析html-词法分析然后解析成dom树、解析css生成css规则树、合并成render树，然后layout、painting渲染、复合图层的合成、GPU绘制、外链资源的处理、loaded和domcontentloaded等）

CSS的可视化格式模型（元素的渲染规则，如包含块，控制框，BFC，IFC等概念）

JS引擎解析过程（JS的解释阶段，预处理阶段，执行阶段生成执行上下文，VO，作用域链、回收机制等等）

其它（可以拓展不同的知识模块，如跨域，web安全，hybrid模式等等内容）

接下来的内容也会参考那篇博客，根据这几个点展开描述。

###1.从浏览器接收url到开启网络请求线程

多线程的浏览器

浏览器也像一个操作系统一样，是个多进程的结构，他的每个tag页面都是一个进程，当然远不止这些，这些进程可能还会包括：

浏览器的主线程，复杂协调、主控
第三方插件进程：这种第三方的插件一般是一个进程，当然只有在插件被调用的时候被创建。
GPU进程：最多一个，用于3D绘制
浏览器的渲染进程（内核）：一般默认每个tab页面一个进程，互不影响，用于页面的渲染和脚本事件的执行。

多线程浏览器内核

正如操作系统中那样，浏览器的tab是一个进程，同时这个进程可能还会分为多个线程，具体可能有下面的进程：

GUI线程
JS引擎线程
事件触发线程
定时器线程
网络请求线程

这里，js线程是一个线程存在的，所以我们常说js是个单线程的，他是和其他的线程（如时间触发线程，异步请求线程等）并发进行的。

解析Url

在输入url确认后，浏览器会对其进行相关的解析，主要从下面的部分进行：

protocol，协议头，譬如有http，ftp等
host，主机域名或IP地址
port，端口号
path，目录路径
query，即查询参数
fragment，即#后的hash值，一般用来定位到某个位置

之后会根据解析的结果，结合HTTP协议，开辟一个网络线程，生成请求去请求资源。

从Url到页面加载的前端知识梳理

涉及到的知识

多线程的浏览器

多线程浏览器内核

解析Url

开启网络线程到发出一个完整的http请求

DNS查询

TCP建立连接和关闭连接

从服务器接收到请求到对应后台接收到请求