-
-
-
-
-
-
Apache NiFi 2.x Processor、Input Port和Output Port 说明
1. Processor(处理器)核心作用: 执行数据处理的原子操作,如读取、转换、路由、过滤、写入等。每个处理器通过**关系(Relationships)**定义数据流的去向(例如 success、failure、retry),需在连接时明确指定。支持配置...
03月06日[精选文章]浏览:22
-
一文带您理解Apache Parquet:高效存储和处理大数据的利器
Apache Parquet是一种高效的列式存储格式,旨在提供在大数据处理环境中的高性能和可扩展性。它使用了一个自描述的、存储效率高的、高度可扩展的列式存储格式,以便有效地存储和处理大规模数据集。Parquet是Apache Hadoop生态系统的一部分,被广泛应用于数据分析、数据湖、机器学习、数据...
03月06日[精选文章]浏览:21
-
别人家的 InfluxDB 实战 + 源码剖析
1前几次的分享,我们多次提到了下图中 Metrics 指标监控的 Prometheus、Grafana,而且 get 到了 influxdata 旗下的 InfluxDB 的入门技能。...
03月05日[精选文章]浏览:19
-
-
Flink on Yarn运行模式之详细解析
独立部署(Standalone)模式由Flink自身提供计算资源,无需其他框架提供资源,这种方式降低了和其他第三方资源框架的耦合性,独立性非常强。但是我们也要知道,Flink主要是计算框架,而不是资源调度框架,所以本身提供的资源调度并不是它的强项,所以还是和其他专业的资源调度框架集成更靠谱,所以接下...
03月05日[精选文章]浏览:21