作者 | 糖果candy
导读
introduction
如果你是一个前端程序员,你不懂得像PHP、Python或Ruby等动态编程语言,然后你想创建自己的服务,那么Node.js是一个非常好的选择。
Node.js 是运行在服务端的 JavaScript,如果你熟悉Javascript,那么你将会很容易学会Node.js。
当然,如果你是后端程序员,想部署一些高性能的服务,那么学习Node.js也是一个非常好的选择。
全文6723字,预计阅读时间17分钟。
GEEK TALK
01
什么是Node.js?
我们先看一下官方对Node.js的定义:Node.js是一个基于V8 JavaScript引擎的JavaScript运行时环境。
但是这句话可能有点笼统:
1、什么是JavaScript运行环境?
2、为什么JavaScript需要特别的运行环境呢?
3、什么又是JavaScript引擎?
4、什么是V8?
带着这些疑问我们先了解一下nodejs的历史,在 Node.js 出现之前,最常见的 JavaScript 运行时环境是浏览器,也叫做 JavaScript 的宿主环境。浏览器为 JavaScript 提供了 DOM API,能够让 JavaScript 操作浏览器环境(JS 环境)。
2009 年初 Node.js 出现了,它是基于 Chrome V8 引擎开发的 JavaScript 运行时环境,所以 Node.js 也是 JavaScript 的一种宿主环境。而它的底层就是我们所熟悉的 Chrome 浏览器的 JavaScript 引擎,因此本质上和在 Chrome 浏览器中运行的 JavaScript 并没有什么区别。但是,Node.js 的运行环境和浏览器的运行环境还是不一样的。
通俗点讲,也就是说Node.js基于V8引擎来执行JavaScript的代码,但是不仅仅只有V8引擎。
我们知道V8可以嵌入到任何C++应用程序中,无论是Chrome还是Node.js,事实上都是嵌入了V8引擎来执行JavaScript代码,但是在Chrome浏览器中,还需要解析、渲染HTML、CSS等相关渲染引擎,另外还需要提供支持浏览器操作的API、浏览器自己的事件循环等。
另外,在Node.js中我们也需要进行一些额外的操作,比如文件系统读/写、网络IO、加密、压缩解压文件等操作。
那么接下来我们来看一下浏览器是如何解析渲染的。
GEEK TALK
02
浏览器是怎么渲染一个页面的?
浏览器渲染一个网页,简单来说可以分为以下几个步骤:
相信看到这里,大家对浏览器怎么渲染出一个页面已经有了大致的了解。页面的绘制其实就是浏览器将 HTML 文本转化为对应页面帧的过程,页面的内容及渲染过程与第一步拿到的 HTML 文本是紧密相关的。
GEEK TALK
03
事件循环和异步IO
首先要了解事件循环是什么?那么我们先了解进程和线上的概念。
每一个进程中都会启动一个线程用来执行程序中的代码,这个线程称为主线程。
举例子:比如工厂相当于操作系统,工厂里的车间相当于进程,车间里的工人相当于是线程,所以进程相当于是线程的容器。
那么浏览器是一个进程吗?它里面是只有一个线程吗?
目前浏览器一般都是多进程的,一般开启一个tab就会开启一个新的进程,这个是防止一个页面卡死而造成的所有页面都无法响应,整个浏览器需要强制退出。
其中每一个进程当中有包含了多个线程,其中包含了执行js代码的线程。
js代码是在一个单独的线程中执行的,单线程同一时间只能做一件事,如果这件事非常耗时,就意味着当前的线程会被阻塞,浏览器时间循环维护两个队列:宏任务队列和微任务队列。
那么事件循环对于两个队列的优先级是怎么样的呢?
new promise()是同步,promise.then,promise.catch,resolve,reject 是微任务。
GEEK TALK
04
使用事件驱动程序
Node.js 使用事件驱动模型,当web server接收到请求,就把它关闭然后进行处理,然后去服务下一个web请求。
当这个请求完成,它被放回处理队列,当到达队列开头,这个结果被返回给用户。
这个模型非常高效可扩展性非常强,因为webserver一直接受请求而不等待任何读写操作。(这也被称之为非阻塞式IO或者事件驱动IO)
在事件驱动模型中,会生成一个主循环来监听事件,当检测到事件时触发回调函数。
整个事件驱动的流程就是这么实现的,非常简洁。有点类似于观察者模式,事件相当于一个主题(Subject),而所有注册到这个事件上的处理函数相当于观察者(Observer)。
Node.js 有多个内置的事件,我们可以通过引入 events 模块,并通过实例化 EventEmitter 类来绑定和监听事件,如下实例:
// 引入 events 模块var events = require('events');// 创建 eventEmitter 对象var eventEmitter = new events.EventEmitter();
以下程序绑定事件处理程序:
// 绑定事件及事件的处理程序eventEmitter.on('eventName', eventHandler);
我们可以通过程序触发事件:
// 触发事件eventEmitter.emit('eventName');
实例
创建 main.js 文件,代码如下所示:
// 引入 events 模块var events = require('events');// 创建 eventEmitter 对象var eventEmitter = new events.EventEmitter();// 创建事件处理程序var connectHandler = functionconnected() { console.log('连接成功~~~'); // 触发 data_received 事件 eventEmitter.emit('data_received');}// 绑定 connection 事件处理程序eventEmitter.on('connection', connectHandler);// 使用匿名函数绑定 data_received 事件eventEmitter.on('data_received', function(){ console.log('数据接收完毕。');});// 触发 connection 事件 eventEmitter.emit('connection');console.log("程序执行完毕。");
接下来让我们执行以上代码:
$ node main.js连接成功~~~数据接收完毕。程序执行完毕。
GEEK TALK
05
Node.js架构以及与浏览器的区别
上图是 Node.js 的基本架构,我们可以看到,(Node.js 是运行在操作系统之上的),它底层由 V8 JavaScript 引擎,以及一些 C/C++ 写的库构成,包括 libUV 库、c-ares、llhttp/http-parser、open-ssl、zlib 等等。
其中,libUV 负责处理事件循环,c-ares、llhttp/http-parser、open-ssl、zlib 等库提供 DNS 解析、HTTP 协议、HTTPS 和文件压缩等功能。
在这些模块的上一层是中间层,中间层包括Node.js Bindings、Node.js Standard Library以及C/C++ AddOns。Node.js Bindings层的作用是将底层那些用 C/C++ 写的库接口暴露给 JS 环境,而Node.js Standard Library是 Node.js 本身的核心模块。至于C/C++ AddOns,它可以让用户自己的 C/C++ 模块通过桥接的方式提供给Node.js。
中间层之上就是 Node.js 的 API 层了,我们使用 Node.js 开发应用,主要是使用 Node.js 的 API 层,所以 Node.js 的应用最终就运行在 Node.js 的 API 层之上。
总结一下:Node.js 系统架构图,主要就是application、V8 javascript 引擎、Node.js bindings, libuv这4个部分组成的。
浏览器中的事件循环是根据HTML5规范来实现的,不同的浏览器可能有不同的实现,而node中是libuv 实现的
因为 Node.js 不是浏览器,所以它不具有浏览器提供的 DOM API。
也有一些对象是 Node.js 和浏览器共有的,如 JavaScript 引擎的内置对象,它们由 V8 引擎提供。常见的还有:
此外,还有一些方法不属于引擎内置 API,但是两者都能实现,比如 setTimeout、setInterval 方法,Console 对象等等。
5.1 阻塞IO和非阻塞IO
如果我们希望在程序中对一个文件进行操作,那么我们就需要打开这个文件:通过文件描述符。
我们思考:JavaScript可以直接对一个文件进行操作吗?
看起来是可以的,但是事实上我们任何程序中的文件操作都是需要进行系统调用(操作系统的文件系统);事实上对文件的操作,是一个操作系统的IO操作(输入、输出)。
操作系统为我们提供了阻塞式调用和非阻塞式调用:
所以我们开发中的很多耗时操作,都可以基于这样的 非阻塞式调用:
比如网络请求本身使用了Socket通信,而Socket本身提供了select模型,可以进行非阻塞方式的工作;
比如文件读写的IO操作,我们可以使用操作系统提供的基于事件的回调机制。
5.2 非阻塞IO的问题
但是非阻塞IO也会存在一定的问题:我们并没有获取到需要读取(我们以读取为例)的结果,那么就意味着为了可以知道是否读取到了完整的数据,我们需要频繁的去确定读取到的数据是否是完整的。
这个过程我们称之为轮训操作。
那么这个轮训的工作由谁来完成呢?
如果我们的主线程频繁的去进行轮训的工作,那么必然会大大降低性能,并且开发中我们可能不只是一个文件的读写,可能是多个文件,而且可能是多个功能:网络的IO、数据库的IO、子进程调用。
libuv提供了一个线程池(Thread Pool):线程池会负责所有相关的操作,并且会通过轮训等方式等待结果。当获取到结果时,就可以将对应的回调放到事件循环(某一个事件队列)中。事件循环就可以负责接管后续的回调工作,告知JavaScript应用程序执行对应的回调函数。
5.3 阻塞和非阻塞,同步和异步的区别?
首先阻塞和非阻塞是对于被调用者来说的;在我们这里就是系统调用,操作系统为我们提供了阻塞调用和非阻塞调用,同步和异步是对于调用者来说的。
Libuv采用的就是非阻塞异步IO的调用方式。
5.4 Node事件循环的阶段
我们最前面就强调过,事件循环像是一个桥梁,是连接着应用程序的JavaScript和系统调用之间的通道:
无论是我们的文件IO、数据库、网络IO、定时器、子进程,在完成对应的操作后,都会将对应的结果和回调
函数放到事件循环(任务队列)中;
事件循环会不断的从任务队列中取出对应的事件(回调函数)来执行;
但是一次完整的事件循环Tick分成很多个阶段:
定时器(Timers):本阶段执行已经被 setTimeout() 和 setInterval() 的调度回调函数。
待定回调(Pending Callback):对某些系统操作(如TCP错误类型)执行回调,比如TCP连接时接收idle, prepare:仅系统内部使用。
轮询(Poll):检索新的 I/O 事件;执行与 I/O 相关的回调;
检测:setImmediate() 回调函数在这里执行。
关闭的回调函数:一些关闭的回调函数,如:socket.on('close', ...)。
5.5 Node事件循环的阶段图解
GEEK TALK
06
Node.js常见的内置模块与全局变量
如想了解更多全局对象可参考以下链接 :https://m.runoob.com/nodejs/nodejs-global-object.html
作者:糖果candy
来源:微信公众号:百度Geek说
出处
:https://mp.weixin.qq.com/s/QI9l4kKCbJxifNZt3QP3Lg