moguli20 第181页_莫古技术网

Apache Parquet是一种高效的列式存储格式，旨在提供在大数据处理环境中的高性能和可扩展性。它使用了一个自描述的、存储效率高的、高度可扩展的列式存储格式，以便有效地存储和处理大规模数据集。Parquet是Apache Hadoop生态系统的一部分，被广泛应用于数据分析、数据湖、机器学习、数据...

03月06日[精选文章]浏览：21apache get

别人家的 InfluxDB 实战 + 源码剖析

1前几次的分享，我们多次提到了下图中 Metrics 指标监控的 Prometheus、Grafana，而且 get 到了 influxdata 旗下的 InfluxDB 的入门技能。...

03月05日[精选文章]浏览：19ci apache

CI/CD 流水线设计与优化策略教程

CI/CD 流水线设计与优化策略教程1. 简介CI/CD (持续集成/持续交付/持续部署 ...

03月05日[精选文章]浏览：21ci apache

Flink on Yarn运行模式之详细解析

独立部署（Standalone）模式由Flink自身提供计算资源，无需其他框架提供资源，这种方式降低了和其他第三方资源框架的耦合性，独立性非常强。但是我们也要知道，Flink主要是计算框架，而不是资源调度框架，所以本身提供的资源调度并不是它的强项，所以还是和其他专业的资源调度框架集成更靠谱，所以接下...

03月05日[精选文章]浏览：21ci apache