-
-
Apache NiFi 2.x Processor、Input Port和Output Port 说明
1. Processor(处理器)核心作用: 执行数据处理的原子操作,如读取、转换、路由、过滤、写入等。每个处理器通过**关系(Relationships)**定义数据流的去向(例如 success、failure、retry),需在连接时明确指定。支持配置...
03月06日[精选文章]浏览:24
-
一文带您理解Apache Parquet:高效存储和处理大数据的利器
Apache Parquet是一种高效的列式存储格式,旨在提供在大数据处理环境中的高性能和可扩展性。它使用了一个自描述的、存储效率高的、高度可扩展的列式存储格式,以便有效地存储和处理大规模数据集。Parquet是Apache Hadoop生态系统的一部分,被广泛应用于数据分析、数据湖、机器学习、数据...
03月06日[精选文章]浏览:22