寫(xiě)文章

首頁(yè) 手記 Node.js 高級(jí)技巧：流轉(zhuǎn)換實(shí)戰(zhàn)

Node.js 高級(jí)技巧：流轉(zhuǎn)換實(shí)戰(zhàn)

標(biāo)簽：

Node.js

在这篇文章中，今天我们将深入探讨如何创建一个健壮且可重用的数据流处理系统，你可以在应用中使用它。

Node.js 流的难题

尽管 Node.js 提供了内置的流功能，但创建可重用和可组合的转换流处理通常需要编写大量的样板代码和，并且需要仔细处理错误。常见的挑战包括如下：

安全地处理异步变换
正确处理背压
创建可组合的流管道线
优雅地处理错误情况
支持单个和批量转换操作

搭建一个可靠的StreamTransformer

让我们创建一个灵活的 StreamTransformer 类来应对这些挑战。下面是一个实现示例：

    const { Transform, Readable } = require('stream');  

    class StreamTransformer {  
      constructor(options = {}) {  
        const {   
          transform,   
          flush = null,   
          objectMode = true   
        } = options;  

        如果 transform 不是一个函数 {  
          throw new Error('需要提供一个变换函数');  
        }  

        return new Transform({  
          objectMode,  

          async transform(chunk, encoding, callback) {  
            try {  
              const result = await transform(chunk, this);  

              if (Array.isArray(result)) {  
                result.forEach(item => this.push(item));  
              } else if (result !== null && result !== undefined) {  
                this.push(result);  
              }  

              callback(null);  
            } catch (error) {  
              callback(error);  
            }  
          },  

          async flush(callback) {  
            try {  
              如果有 flush {  
                const result = await flush(this);  
                如果有结果 {  
                  this.push(result);  
                }  
              }  
              callback(null);  
            } catch (error) {  
              callback(error);  
            }  
          }  
        });  
      }  

      静态管道(...变换器) {  
        返回 {  
          通过: (输入流) => {  
            返回 变换器.reduce(  
              (流, 变换器) => 流.pipe(变换器),  
              输入流  
            );  
          }  
        };  
      }  
    }

关键功能介绍

异步变换支持

变压器完全支持 transform 和 flush 函数中的异步操作。这对于从外部来源丰富数据的真实场景特别重要。

    const enrichUserData = new StreamTransformer({
      async transform(user) {
        // 模拟调用API来增强用户数据
        const additionalData = await fetchUserDetails(user.id);
        return { ...user, ...additionalData };
      }
    });

2. 灵活的输出管理

变压器可以处理多种类型的输出信息：

单个值，
数组（自动展开），
空值/未定义值（被过滤），

（每项之间用逗号隔开以增加流畅性）

    const batchProcessor = new StreamTransformer({  
      transform: async (chunk) => {  
        const results = await processBatch(chunk);  
        return results; // 可以返回一个数组或单个值  
      }  
    });

3. 管道组成结构

静态的 pipeline 方法可以优雅地组合使用多个转换器：

const pipeline = StreamTransformer.pipeline(  
  // 过滤转换器，用于过滤数据流
  filterTransformer,  
  // 丰富转换器，用于丰富数据
  enrichmentTransformer,  
  // 格式转换器，用于格式化数据
  formatTransformer  
);  

pipeline.through(sourceStream)  
  // 监听数据事件，打印数据
  .on('data', console.log)  
  // 监听错误事件，打印错误信息
  .on('error', console.error);

实际案例

示例 1: 数据校验及转换

    const validationTransformer = new StreamTransformer({  
      transform: (data) => {  
        if (!data.id || !data.name) {  
          return null; // 过滤掉无效的记录  
        }  
        return {  
          ...data,  
          validated: true,  
          timestamp: Date.now() // 当前时间戳  
        };  
      }  
    });

示例 2：批处理

    const batchTransformer = new StreamTransformer({  
      transform: async (records) => {  
        // 批量处理记录，返回每个记录的丰富数据  
        const processedBatch = await Promise.all(  
          records.map(async record => {  
            const enriched = await 丰富数据(record);  
            return enriched;  
          })  
        );  
        return processedBatch;  
      }  
    });

例子 3: 错误处理和日志

    const robustTransformer = new StreamTransformer({  
      transform: async (data) => {  
        try {  
          const result = await processData(data);  
          return result;  
        } catch (error) {  
          console.error('处理数据时发生错误:', error);  
          // 返回 null 来排除失败项  
          return null;  
        }  
      },  
      flush: async () => {  
        // 清理资源并记录统计数据  
        await cleanup();  
        console.log('处理完毕');  
      }  
    });

最佳做法

1. 处理错误：

总是用 try/catch 块包裹异步操作
考虑是终止整个流，还是仅仅跳过有问题的部分
使用 flush 方法来清理

2. 内存管理

返回 null 来过滤掉不需要的项目
根据你的数据类型适当使用对象模式
在批处理大型数组时要小心

3. 性能

考虑为大数据集实现反压机制。
在适用的情况下使用批处理。
监控大转换过程中内存的使用情况。

最后

一个设计合理的流转换器可以大大简化Node.js应用程序中的数据处理流水线。我们探讨过的这种实现提供了一个灵活且可复用的基石，你可以根据不同的应用场景进行调整。

请记住，数据流是强大的，但需要谨慎处理。

错误处理
内存占用
反压机制
管道构建

考虑到这些模式，你可以构建健壮的数据处理流水线，高效处理海量数据，同时确保代码质量和模块化。

链接：

GitHub 上的所有示例
StreamTransformer.js

看直播快乐！

这是一个联系我的方式：

const findMeAt = {  
  email: "chechavalera@gmail.com", // 电子邮件  
  github: "https://github.com/v-checha", // GitHub 
  linkedIn: "https://www.linkedin.com/in/v-checha/", // 领英  
};

可提供技术咨询和演讲服务。
[MCP]: 模型上下文协议 (MCP)
[LLM]: 大规模语言模型
[RAG]: 检索增强生成
[SSE]: 服务器发送事件 (SSE)

點(diǎn)擊查看更多內(nèi)容

為 TA 點(diǎn)贊

若覺(jué)得本文不錯(cuò)，就分享一下吧！

評(píng)論

評(píng)論

共同學(xué)習(xí)，寫(xiě)下你的評(píng)論

評(píng)論加載中...

展開(kāi)查看更多評(píng)論

作者其他優(yōu)質(zhì)文章

正在加載中

慕容森

手記
篇

粉絲

183

獲贊與收藏

653

關(guān)注作者，訂閱最新文章

閱讀免費(fèi)教程

后端通用面試教程

41個(gè)小節(jié) 32473 366

網(wǎng)絡(luò)編程入門(mén)教程

20個(gè)小節(jié) 13439 255

Pandas 入門(mén)教程

25個(gè)小節(jié) 20073 381

推薦

評(píng)論

收藏

共同學(xué)習(xí)，寫(xiě)下你的評(píng)論



感謝您的支持，我會(huì)繼續(xù)努力的～

掃碼打賞，你說(shuō)多少就多少

贊賞金額會(huì)直接到老師賬戶

支付方式

打開(kāi)微信掃一掃，即可進(jìn)行掃碼打賞哦

今天注冊(cè)有機(jī)會(huì)得

100積分直接送

付費(fèi)專欄免費(fèi)學(xué)

大額優(yōu)惠券免費(fèi)領(lǐng)

立即參與放棄機(jī)會(huì)

點(diǎn)擊
抽獎(jiǎng)

慕課手記新用戶專享福利

恭喜你，你的運(yùn)氣太好了，居然抽中了 100個(gè)積分！

恭喜你，抽中了價(jià)值元的專欄！

太棒了，直接落到你賬戶里！

積分商城里的羅技鼠標(biāo)、機(jī)械鍵盤(pán)、
Kindle 閱讀器、小米平衡車
Apple iPad （10.2英寸）、大額優(yōu)惠券
在等著你去兌換了噢

作者：

免費(fèi)贈(zèng)送

兌換碼：1111222211 復(fù)制

優(yōu)惠券可用于購(gòu)買實(shí)戰(zhàn)課、體系課
無(wú)門(mén)檻使用

先去看看，有什么好東西馬上兌換


第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

熱搜

最近搜索清空

Node.js 高級(jí)技巧：流轉(zhuǎn)換實(shí)戰(zhàn)

閱讀免費(fèi)教程