使用 Node.js 流進行高效能資料處理

發佈於2024-11-09

Efficient Data Handling with Node.js Streams

在本文中，我们将深入研究 Node.js Streams 并了解它们如何帮助高效处理大量数据。流提供了一种处理大型数据集的优雅方式，例如读取大型文件、通过网络传输数据或处理实时信息。与一次性读取或写入整个数据的传统 I/O 操作不同，流将数据分解为可管理的块并逐块处理它们，从而实现高效的内存使用。

在本文中，我们将介绍：

什么是 Node.js Streams？
Node.js 中不同类型的流。
如何创建和使用流。
流的真实用例。
使用流的优点。

什么是 Node.js 流？

Node.js 中的 stream 是连续的数据流。流对于处理 I/O 密集型任务特别有用，例如读取文件、通过网络通信或与数据库交互。流无需等待整个操作完成，而是可以分块处理数据。

流的主要特点：

事件驱动：流构建在 Node.js 的事件驱动架构之上，允许在数据可用时立即处理数据。
内存高效：流将数据分成块并逐块处理，减少系统的内存负载。
非阻塞：Node.js 流可以异步处理大数据，而不会阻塞主事件循环。

Node.js 中的流类型

Node.js提供了四种类型的流：

可读流：可以从中读取数据的流。
可写流：可以写入数据的流。
双工流：可读可写的流（例如网络套接字）。
转换流：在读取或写入时修改或转换数据的流（例如，压缩或解压缩文件）。

使用 Node.js 流

让我们通过示例探索每种类型的流。

3.1 可读流

可读流允许您逐段读取数据，这对于处理大文件或实时数据源很有用。


const fs = require('fs');

// Create a readable stream from a large file
const readableStream = fs.createReadStream('largeFile.txt', {
    encoding: 'utf8',
    highWaterMark: 16 * 1024 // 16 KB chunk size
});

readableStream.on('data', (chunk) => {
    console.log('New chunk received:', chunk);
});

readableStream.on('end', () => {
    console.log('Reading file completed');
});

在此示例中，createReadStream 方法以 16 KB 的块读取文件。
每个块一旦可用就会立即处理，而不是等待整个文件加载到内存中。
结束事件标志着读取过程的完成。

3.2 可写流

可写流用于将数据增量写入目的地，例如文件或网络套接字。


const fs = require('fs');

// Create a writable stream to write data to a file
const writableStream = fs.createWriteStream('output.txt');

writableStream.write('Hello, world!\n');
writableStream.write('Writing data chunk by chunk.\n');

// End the stream and close the file
writableStream.end(() => {
    console.log('File writing completed');
});

write 以增量方式将数据发送到文件。
结束函数表示不再写入数据并关闭流。

3.3 双工流

一个双工流可以读写数据。一个常见的例子是 TCP 套接字，它可以同时发送和接收数据。


const net = require('net');

// Create a duplex stream (a simple echo server)
const server = net.createServer((socket) => {
    socket.on('data', (data) => {
        console.log('Received:', data.toString());
        // Echo the data back to the client
        socket.write(`Echo: ${data}`);
    });

    socket.on('end', () => {
        console.log('Connection closed');
    });
});

server.listen(8080, () => {
    console.log('Server listening on port 8080');
});

此示例创建一个基本的回显服务器，用于从客户端读取传入数据并将其发送回。
当需要双向通信时（例如在网络协议中），双工流非常方便。

3.4 变换流

A 转换流是一种特殊类型的双工流，它在数据通过时修改数据。一个常见的用例是文件压缩。


const fs = require('fs');
const zlib = require('zlib');

// Create a readable stream for a file and a writable stream for the output file
const readable = fs.createReadStream('input.txt');
const writable = fs.createWriteStream('input.txt.gz');

// Create a transform stream that compresses the file
const gzip = zlib.createGzip();

// Pipe the readable stream into the transform stream, then into the writable stream
readable.pipe(gzip).pipe(writable);

writable.on('finish', () => {
    console.log('File successfully compressed');
});