NodeJS Stream的雙工流

2024-04-27 15:13:11

字體：大中小

來源：轉載

供稿：網友

雙工流就是同時實現了 Readable 和 Writable 的流，即可以作為上游生產數據，又可以作為下游消費數據，這樣可以處于數據流動管道的中間部分，即

rs.pipe(rws1).pipe(rws2).pipe(rws3).pipe(ws);

在 NodeJS 中雙工流常用的有兩種

DuplexTransform

Duplex

實現 Duplex

和 Readable、Writable 實現方法類似，實現 Duplex 流非常簡單，但 Duplex 同時實現了 Readable 和 Writable， NodeJS 不支持多繼承，所以我們需要繼承 Duplex 類

繼承 Duplex 類實現 _read() 方法實現 _write() 方法

相信大家對 read()、write() 方法的實現不會陌生，因為和 Readable、Writable 完全一樣。

const Duplex = require('stream').Duplex;const myDuplex = new Duplex({ read(size) { // ... }, write(chunk, encoding, callback) { // ... }});

構造函數參數

Duplex 實例內同時包含可讀流和可寫流，在實例化 Duplex 類的時候可以傳遞幾個參數

readableObjectMode : 可讀流是否設置為 ObjectMode，默認 falsewritableObjectMode : 可寫流是否設置為 ObjectMode，默認 falseallowHalfOpen : 默認 true，設置成 false 的話，當寫入端結束的時，流會自動的結束讀取端，反之亦然。

小例子

了解了 Readable 和 Writable 之后看 Duplex 非常簡單，直接用一個官網的例子

當然這是不能執行的偽代碼，但是 Duplex 的作用可見一斑，進可以生產數據，又可以消費數據，所以才可以處于數據流動管道的中間環節，常見的 Duplex 流有

Tcp ScoketZlibCrypto

Transform

Transform 同樣是雙工流，看起來和 Duplex 重復了，但兩者有一個重要的區別：Duplex 雖然同事具備可讀流和可寫流，但兩者是相對獨立的；Transform 的可讀流的數據會經過一定的處理過程自動進入可寫流。

雖然會從可讀流進入可寫流，但并不意味這兩者的數據量相同，上面說的一定的處理邏輯會決定如果 tranform 可讀流，然后放入可寫流，transform 原義即為轉變，很貼切的描述了 Transform 流作用。

我們最常見的壓縮、解壓縮用的 zlib 即為 Transform 流，壓縮、解壓前后的數據量明顯不同，兒流的作用就是輸入一個 zip 包，輸入一個解壓文件或反過來。我們平時用的大部分雙工流都是 Transform。

實現 Tranform

Tranform 類內部繼承了 Duplex 并實現了 writable.write() 和 readable._read() 方法，我們想自定義一個 Transform 流，只需要

繼承 Transform 類實現 _transform() 方法實現 _flush() 方法（可以不實現）

_transform(chunk, encoding, callback) 方法用來接收數據，并產生輸出，參數我們已經很熟悉了，和 Writable 一樣， chunk 默認是 Buffer，除非 decodeStrings 被設置為 false。

在 _transform() 方法內部可以調用 this.push(data) 生產數據，交給可寫流，也可以不調用，意味著輸入不會產生輸出。

當數據處理完了必須調用 callback(err, data) ，第一個參數用于傳遞錯誤信息，第二個參數可以省略，如果被傳入了，效果和 this.push(data) 一樣

transform.PRototype._transform = function (data, encoding, callback) { this.push(data); callback();};transform.prototype._transform = function (data, encoding, callback) { callback(null, data);};

有些時候，transform 操作可能需要在流的最后多寫入可寫流一些數據。例如， Zlib流會存儲一些內部狀態，以便優化壓縮輸出。在這種情況下，可以使用_flush()方法，它會在所有寫入數據被消費、觸發 'end'之前被調用。