使用 Nginx 作为你的开发代理工具

812次阅读  |  发布于2年以前

简介

Nginx 是一个高性能的 HTTP 服务器,也可以当作电子邮件代理服务器;其特点是占有内存少,并发能力强且非常稳定,并且有着丰富的模块库,配置灵活简单;因为上述特点,现在 Nginx 几乎已经是互联网系统中不可或缺的一部分;

性能天花板

Nginx 作为一个 web 服务器,差不多可以称为 “性能天花板” 了,在做一些优化之后,Nginx 甚至能做到 “单机百万 QPS” 的表现;因为这逆天的性能表现,国内的互联网大厂基本都会使用 Nginx 作为自己的网关,直接承载所有的线上流量;那 Nginx 为什么能拥有这么 的性能呢?

架构设计

因为散热的原因,CPU 的频率已经十多年没有增长了(下图绿色部分),而 CPU 的频率就决定了它的指令执行速度;

CPU 厂商对这一问题的解决方案是横向的往多核方向发展,这就意味着所有的单进程、单线程的软件性能都将无法从 CPU 升级上获得提升,想提升服务器的 QPS,就必须充分使用 CPU 的多个核,那应该如何有效利用 CPU 多核的特性呢?

线程是 CPU 调度的最小单位,支持多线程的软件就可以同时使用 CPU 多个核的算力,进程是比线程更大的粒度,所以支持多进程也可以,Nginx 就采用了多进程的架构;Nginx 中主要包含下面几种进程:

Nginx 服务器启动后,会生成一个 master 进程,master 线程在完成自己的工作后就开始创建 worker 进程,随后进入 sleep 的状态,不占用过多的计算资源;

worker 进程是实际处理用户请求的进程,又因为 Nginx 采用事件驱动的非阻塞 I/O 架构设计,并发数高的时候 worker 进程将会一直保持 running 的状态,理论上一个 worker 就能吃掉一整个 CPU 核心的算力,所以默认情况下 nginx 会根据系统的 CPU 核心数来创建 worker 进程,有几个核就创建几个 worker 进程;

那多个 worker 进程是怎么监听同一个端口的?大家本地启动开发服务器的时候应该遇到过端口被占用的报错;master 进程监听了 80、443 端口,worker 进程属于 master 的子进程,在 linux 中子进程将默认继承父进程监听的端口;

使用 master/worker 除了能充分利用 CPU 多核的算力之外,还带来了一些其他诸如 “热升级” 的好处;

榨干 CPU 算力

虽然说架构设计很重要,但光架构设计还不足以让 Nginx 有这么强大的性能;Nginx 还通过其他各种手段榨干 CPU 的算力,抢占服务器上其他应用的计算资源;比如:

上面说的高并发时 Nginx 的 worker 进程会一直保持 running 的状态,抢占 CPU 的算力,但 Linux 作为分时操作系统,会将 CPU 的执行时间分为许多碎片,交由所有进程轮番执行。这些时间片有长有短,从5毫秒到800毫秒不等,内核分配其长短时,会依据进程的静态优先级来分配。没错,Nginx 为了让 worker 进程能分到更长的时间片,会增加 worker 进程的静态优先级,让它能够抢占到更多的 CPU 计算时间;

想做到高性能,必须同时拥有 “好架构” ➕ “好的细节处理”;

使用入门

Nginx 的配置系统由一个主配置文件和其他一些辅助的配置文件构成。这些配置文件均是纯文本文件,全部位于 Nginx 安装目录下的 conf 目录下。

配置文件中以 # 开始的行,或者是前面有若干空格或者 TAB,然后再跟 # 的行,都被认为是注释;

配置文件中可以包含若干配置项,每个配置项由 “配置指令” 和 “指令参数” 2个部分构成,并以 ; 结尾,指令参数也就是配置指令对应的配置值。举个例子:

# 这一行是注释,下一行中的 error_page 为 “配置指令”,其后跟着的是对应的 “指令参数”
error_page   500 502 503 504  /50x.html;

配置指令

配置指令分为两种:

指令参数

指令的参数使用一个或者多个空格或者 TAB 字符与指令分开,由一个或者多个 TOKEN 字符串组成,TOKEN 字符串之间由空格或者TAB键分隔开来;

指令上下文

复杂配置指令中的 httplocationservermail 会产生指令上下文,指令上下文存在嵌套关系,比如:

# main 上下文
user  nginx;
worker_processes  1;
error_log  logs/error.log  info;

events {
    worker_connections  1024;
}

http {
    server {
        listen          80;
        server_name     www.example.com;
        location / {
            index index.html;
        }
    }
}

mail {
    auth_http  127.0.0.1:80/auth.php;
    pop3_capabilities  "TOP"  "USER";
    imap_capabilities  "IMAP4rev1"  "UIDPLUS";

    server {
        listen     110;
        protocol   pop3;
        proxy      on;
    }
}

main 上下文主要用来配置与具体的业务(http 或者邮件)无关的逻辑,比如例子中的:

main 上下文中还包含了 http 指令,http 是 Nginx 服务器配置中最重要的部分,代理、缓存等绝大多数功能和第三方模块的配置都可以放到这个模块中来;mail 可用来定义电子邮件代理服务器相关的配置;

常见指令

include

从其他文件引入配置,可用来对复杂的 Nginx 配置做拆分;

# main 上下文
user  nginx;
worker_processes  1;
error_log  logs/error.log  info;

events {
    worker_connections  1024;
}

http {
    server {
        listen          80;
        server_name     www.example.com;
        location / {
            index index.html;
        }
    }
    include /etc/nginx/conf.d/*.conf;
}

server

server 块用来配置 “虚拟服务器” ,每一个 server 块都相当于一台 “虚拟服务器”,“虚拟服务器” 是一个与实体服务器相对应的概念,将一台实体服务器进行划分,对外表现为多个服务器,可以充分利用服务器的硬件资源,并且可以不用为每一个要运行的网站提供单独的 Nginx 服务器;

server {
    listen 80;
    server_name a.com;

    location / {
        proxy_pass https://www.baidu.com;
    }
}
server {
    listen 80;
    server_name b.com;

    location / {
        proxy_pass https://www.google.com;
    }
}

server 中最重要的两条指令为 listenserver_name ,这两条指令共同决定了一个请求究竟会打到哪一个 “虚拟服务器中”;

listen

用来配置 “虚拟服务器” 监听的 ipport,只能配置在 server 块中,具体语法:

# 只监听来自 127.0.0.1 这个 IP,请求 8000 端口的请求
listen 127.0.0.1:8000;
# 只监听来自 127.0.0.1 这个IP,请求 80端 口的请求(不指定端口,默认80)
listen 127.0.0.1;
# 监听来自所有 IP,请求 8000 端口的请求
listen 8000;
# 监听 80 端口的请求,且如果没有其他 server_name 能匹配上的话将会默认匹配该 server
listen 80 default_server;

server_name

用来配置 “虚拟服务器” 的网址,只能配置在 server 块中,具体语法:

server_name    myserver.com    www.myserver.com;
# 还可以使用通配符 *
server_name    myserver.*    *.myserver.com;
# 还可以使用正则
server_name    ~^(?<www>.+).example.org$;

存在通配符以及正则的话,则存在多个 server_name 被同时匹配上的可能,当有多个匹配上的话,会按照下面的优先级来决定请求打到哪一个 “虚拟服务器”:

1 . 准确匹配的 server_name;

2 . 通配符在开始时匹配的 server_name;

3 . 通配符在结尾时匹配的 server_name;

4 . 正则表达式匹配的 server_name;

1 . locatioin

server 中使用 listen 和 server_name 来区分 “虚拟服务器”,location 指令则让 server 可以非常灵活的处理请求;

location 的语法结构:

location [ = | ~ | ~* | ^~ ] uri {
    ...
}

location 有五种匹配方式:

location 后没有参数直接跟着 标准 URI,表示前缀匹配,代表跟请求中的 URI 从头开始匹配;
= 用于标准 URI 前,要求请求字符串与其精准匹配,成功则立即处理,nginx停止搜索其他匹配。
^~ 用于标准 URI 前,并要求一旦匹配到就会立即处理,不再去匹配其他的那些个正则 URI,一般用来匹配目录
~ 用于正则 URI 前,表示 URI 包含正则表达式,区分大小写
~* 用于正则 URI 前,表示 URI 包含正则表达式,不区分大小写

Nginx 中不会直接按照 location 出现的先后顺序进行匹配,而是按照下面的规则进行匹配:

1 . 先精准匹配 = ,精准匹配成功则会立即停止其他类型匹配;

2 . 没有精准匹配成功时,进行前缀匹配。先查找带有 ^~ 的前缀匹配,带有 ^~ 的前缀匹配成功则立即停止其他类型匹配,普通前缀匹配(不带参数 ^~ )成功则会暂存,继续查找正则匹配;

3 . =^~ 均未匹配成功前提下,查找正则匹配 ~ 和 *`~`** 。当同时有多个正则匹配时,按其在配置文件中出现的先后顺序优先匹配,命中则立即停止其他类型匹配;

4 . 所有正则匹配均未成功时,返回步骤 2 中暂存的普通前缀匹配(不带参数 ^~ )结果;

5 . 所有匹配都不命中时,默认进入 /

1 . rewrite 和 proxy_pass

rewrite 可以出现在 server、location、if 块中,用来改写请求地址,具体的语法如下:

用于**正则 URI** 前,表示 URI 包含正则表达式,不区分大小写

proxy_pass 只能出现在 location、if 块中,用来将请求转发至对应的服务,具体语法如下:

proxy_pass uri;

举个例子:

server {
    rewrite /a.html /b.html break;
    return 200 'ok';

    location /a.html {
        return 200 'a.html';
    }

    location /b.html {
        return 200 'b.html';
    }

    location /c.html {
        proxy_pass http://www.google.com;
    }
}

使用场景

域名 -> 域名

将某一个域名的请求在本地拦截之后,转发到 nginx 中,nginx 将请求转发到其他域名;

server {
    listen 80;
    server_name www.baidu.com;
    location / {
        proxy_pass http://www.google.com;
    }
}

域名 -> 本地 ip

将某一个域名的请求拦截之后,转到到 nginx 中,nginx 将对应的请求打到本地的其他 ip;

server {
    listen 80;
    server_name www.baidu.com;
    location / {
        proxy_pass http://127.0.0.1:8001;
    }
}

路径 -> 域名

根据不同路径将请求转发至不同的域名;

server {
    listen 80;
    server_name www.baidu.com;

    location ^~ /to_google {
        proxy_http_version 1.1;
        rewrite .* /;
        proxy_pass http://google.com/;
    }
}

接口跨域

解决前端本地开发环境调用线上接口时跨域的问题;

server {
    listen 80;

    location ^~ /api {
        proxy_pass http://example.com;

        add_header Access-Control-Allow-Methods *;
        add_header Access-Control-Max-Age 3600;
        add_header Access-Control-Allow-Credentials true;
        add_header Access-Control-Allow-Origin $http_origin;

        if ($request_method = OPTIONS){
            return 200;
        }
    }
}

小结

❤️ 谢谢支持


以上便是本次分享的全部内容,希望对你有所帮助^_^

Copyright© 2013-2020

All Rights Reserved 京ICP备2023019179号-8