Node.js中的Worker Threads

更新日期: 2019-10-06阅读: 2.6k标签: Worker

想要明白workers,首先需要明白node是怎样构成的。当一个node进程开始,它其实是:

  1. 一个进程。
  2. 一个线程。
  3. 一个事件轮垂。
  4. 一个js引擎实例。
  5. 一个node.js实例。

一个进程:是指一个全局对象,这个对象能够访问任何地方,并且包含当前处理时的此时信息。

一个线程:单线程意味着单位时间内只有一组指令在给定的进程中执行。

一个事件轮垂:这是理解Node最重要的概念。它使Node更够异步以及拥有无锁定I/O。即使js是单线程的,通过提供一些系统核心的操作像是回调函数,promise函数以及异步的async/await函数这些功能。

一个JS引擎实例:这是个计算机程序,用来执行js的代码

一个Node.js实例:一个计算机程序用来执行node.js的代码。

一句话,Node运行在一个单线程上,每次事件轮垂只有一个进程存在。一个代码一次执行(不是并行执行)。这个非常重要,因为它很简单,你不用考虑并发的问题。

这么设计的原因是因为js生出来最初是用来开发客户端交互的(像是页面交互,表单这些),没有对线程这种用复杂的需求。

但是,和所有的事情一样,这样也有缺点:如果你有cpu敏感的代码,例如内存中有大量的来回计算的复杂数据,那么这能锁住其他需要进行处理计算的任务。像是,你向服务器发起一个请求,应对这个请求的接口有cpu敏感的代码,那么它就能锁定事件轮垂进而阻止其他请求的处理(笔者:其实就是其他请求就需要长时间排队甚至超时)。

如果主事件轮垂必须等待一个函数执行完成然后才能执行其他命令,那么这个函数就是“锁定中”。一个无锁定函数会允许主事件轮垂从开始就持续地运行,并且在其执行完成时通知主事件轮垂调用回调函数。

黄金准则:不要锁定事件轮垂,尽量关注和避免那些可能造成锁定的任务,像是同步网路调用或者无线死循环。

明白cpu操作和i/o操作是很重要的。如上所讲,Node中的代码不能并行执行。只是i/o是并行,因为他们是异步执行的。

所以,worker线程(以下我们会使用这个node特有的概念)不能提升多少i/o敏感的任务,因为异步i/o本身就比worker高效很多。worker的主要任务是提升cpu敏感操作的性能。


已有的解决方案

此外,这里已经有一些应对cpu敏感处理的方案:多进程(例如,cluster api)来保证cpu最大被利用。

这个方法好处是允许每个进程间是独立的,如果某个线程出了问题,不会影响到其他的。他们稳定且相同的api。然而,这意味着牺牲了内存共享,并且数据通信必须用json(有额外开销,性能稍低)。


JavaScript和Node.js是永远不会有多线程的。原因如下:

so,有人或许会考虑给node.js添加一个新的模块来允许我们创建一个同步线程,以此来解决cpu敏感处理的问题。

然而,这不会实现的。如果添加一个线程,这个语言的本质就会发生变化。使用类或者函数添加一个线程作为新特性是不可能。在支持多线程的语言中(如java),“synchronized”之类的关键字就能帮助实现多线程。

还有,一些数据不是原子的,意味着如果你不是同步处理他们,你可能的结果是在两个线程上都可以访问并更改这个值得变量,最后得到一个两个线程都对这个者进行了一些改变的无效的值。例如一个简单的0.1+20.2的操作,这个操作拥有17为小数。

因为小数点不是100%准确的,所以如果不是同步的,有一个整数可能使用worker之后得到一个非整数的数字。


最好的解决方案是

提高cpu性能的最好的方案是使用worker线程。浏览器很早既有了worker这个概念了。

使亿有的结构从:

一个进程

一个线程

一个事件轮垂

一个JS隐情实例

一个Node.js实例

变成:

一个进程

多个线程

每个线程一个事件轮垂

每个线程一个JS隐情实例

每个线程一个Node.js实例

worker_threads模块能够实现使用线程实现并行执行js。

const worker = require('worker_threads');

Worker Theads在Node.10时开始可以使用,但是一直处于实验状态,在12.11.0时,变成稳定版本。

这个方案的意思是,在一个进程中拥有多个Node.js的实例。在worker threads中,一个线程可以有一些节点,这个节点不必是父进程。worker结束后还被分配着一些资源不是好的实践,这会导致内存泄漏。我们想把node.js整个的潜入其中,并且给与Node.js去创建新的现成的能力,然后在线程中创建一个新的Node.js实例。本质上是独立运行在一个进程中的线程中。

下面这些使Worker Theads与众不同:

ArrayBuffers在线程间传递内存。
SharedArrayBuffer每个线程都可访问,在线程间分享内存。(只限二进制数据)。
Atomics已可用,允许你并行执行一些处理,更高效且允许你在js中实现条件变量。
MessagePort,用来在不同线程间进行通信。可以用来传递结构数据,内存域,以及不同Worker之间的MessagePort(对象)。
MessageChannel代表一个异步的,双向通信的频道,用来在不同的(worker)线程间通信。
WorkerData用来传递起始数据。任意js数据的复制版本会被传递到这个Worker的构造函数中。如果使用postMessage(),数据也会被复制。


接口API

  • const {worker, parentPort} = require('worker_threads'),worker类表示一个独立执行js的线程,parentPort是一个message port的实例。
  • new Worker(filename)或者new worker(code,{eval:true})两种开始一个worker的方法。(传递一个文件名字或需要执行的代码)。建议在生产中使用文件名字。
  • worker.on('message'),worker.postmessage(data)`监听信息以及在不同的线程间发布数据。
  • parentPort.on('message'),parentPort.postMessage(data),使用parentPort.postMessage()发送信息,在父线程中使用worker.on('message')来获取。在父线程中使用worker.postMessage()在该线程中(当前线程是子)使用parentPort.on('message')类获取。


示例

const { Worker } = require('worker_threads');

const worker = new Worker(`
const { parentPort } = require('worker_threads');
parentPort.once('message',
    message => parentPort.postMessage({ pong: message }));  
`, { eval: true });
worker.on('message', message => console.log(message));      
worker.postMessage('ping');  

执行:

$ node --experimental-worker test.js
{ pong: ‘ping’ }

这段代码实际做的是使用new Worker创建了一个线程,在线程的内部使用parentPort来监听和接受一次性的message信息,接收到信息后也会发布一个message个猪线程。

在只支持实验性worker thread的node版本中你必须使用--experimental-worker命令行选项来执行代码。

其他例子:

const {
      Worker, isMainThread, parentPort, workerData
    } = require('worker_threads');

    if (isMainThread) {
      module.exports = function parseJSAsync(script) {
        return new Promise((resolve, reject) => {
          const worker = new Worker(filename, {
            workerData: script
          });
          worker.on('message', resolve);
          worker.on('error', reject);
          worker.on('exit', (code) => {
            if (code !== 0)
              reject(new Error(`Worker stopped with exit code ${code}`));
          });
        });
      };
    } else {
      const { parse } = require('some-js-parsing-library');
      const script = workerData;
      parentPort.postMessage(parse(script));
    }

需要依赖:
Worker该类代表一个独立的js执行线程。
isMainThead一个布尔值,当前代码是否运行在Worker线程中。
parentPortMessagePort对象,如果当前线程是个生成的Worker线程,则允许和父线程通信。
workerData一个可以传递给线程构造函数的任何js数据的的复制数据。

在实战中,上面的任务最好使用线程池来替代。否则,开销可能大于好处。


对Worker的期望是什么(希望是):

  • 传递本地处理任务。(passing native handles around)
  • 锁死检测。锁死是指一种情形,一系列进程被锁定,因为每个进程都把持了一些资源,而且每个线程又在等待其他线程所把持的资源释放然后获取。锁死检测在worker thead中比较有用。
  • 更多的隔离,所以一旦一个线程收到了影响,其他的没事。


对Worker不期望的是:

  • 不要认为worker会使所有的东西都很快速,有些情况下最好使用线程池。
  • 不要使用worker来进行io并行操作。
  • 不要认为衍生一个线程成本很低。


最后:

Workers有chrome开发工具,可用来监视Node.js中的workers。

原文,翻译来自:https://nodesource.com/blog/worker-threads-nodejs


链接: https://www.fly63.com/article/detial/5751

Service Worker的生命周期

service worker的生命周期是它最复杂的部分。如果你不知道它在努力做什么和这么做的优势,你会感到它在跟你对着干。但一旦你知道了它的原理,你就可以给用户提供无缝的,优雅而不突兀的更新。一种同时具备网站应用和原生应用优势的体验。

Web Worker 详细介绍_Web Workers的使用

web worker 是运行在后台的 JavaScript,独立于其他脚本,也就是说在Javascript单线程执行的基础上,开启一个子线程,进行程序处理,而不影响主线程的执行。Service Worker 是一个由事件驱动的 worker,它由源和路径组成,以加载 .js 文件的方式实现的。

web worker是什么?理解并使用web worker

Web Worker 是为了解决 JavaScript 在浏览器环境中没有多线程的问题。正常形况下,浏览器执行某段程序的时候会阻塞直到运行结束后在恢复到正常状态,而HTML5的Web Worker就是为了解决这个问题,提升程序的执行效率。

Web Worker模拟选票

思路:五个人(5个div窗口模拟)同时进行抢票,有百分之十的几率可以抢到票,抢到票后对应的窗口(即随机生成的数大于等于0小于9的情况)会编程天蓝色,没抢到票的窗口(即随机生成的数大于9小于100的情况)会变成红色

动态创建 Web Worker 实践指南

作为前端,在消费接口提供的数据时,往往由于数据实际分布在不同地方(如一部分存储在 ODPS ,而另一部分可能更适合在应用初始化时从本地载入内存)而需要对数据进行区分处理。当然,交互的实现可能也会需要很重的计算逻辑

关于Web Workers你需要了解的7件事

Web Workers允许你在后台运行JavaScript代码,而不会阻止web用户界面。Web Workers可以提高网页的整体性能,还可以增强用户体验。Web Workers有两种风格 ——专用Web Workers和共享Web Workers

如何使用JS中的webWorker?

作为浏览器脚本语言,如果JavaScript不是单线程,那么就有点棘手了。比如,与用户交互或者对DOM进行操作时,在一个线程上修改某个DOM,另外的线程删除DOM,这时浏览器该如何抉择呢?

Web Worker 现状

Web 是单线程的。这让编写流畅又灵敏的应用程序变得越来越困难。Web Worker 的名声很臭,但对 Web 开发者来说,它是解决流畅度问题的 一个非常重要的工具。让我们来了解一下 Web Worker 吧

浅谈 HTML5 Web Worker,性能优化利器?

多线程是现代软件开发中用于增强应用的性能和响应能力的重要技术。然而,JavaScript 是一门单线程语言,它天生是不支持多线程的。为了克服这一限制,引入了 Web Workers。本文就来探讨 Web Workers 对 Web 多线程的重要性,以及使用它们的限制和注意事项。

内容以共享、参考、研究为目的,不存在任何商业目的。其版权属原作者所有,如有侵权或违规,请与小编联系!情况属实本人将予以删除!