-
Rsync 深度剖析:从基础命令到高级应用的实操指南
一、引言在 Linux 系统管理和日常运维工作中,文件的同步和传输是常见且重要的任务。rsync 作为一款强大且高效的文件同步工具,凭借其增量传输、带宽利用优化等特性,在众多场景中发挥着关键作用。本文将详细介绍 rsync 的基本原理、常用命令选项,并结合实际案例深入讲解其应用。...
03月29日[精选文章]浏览:9
-
-
MySQL 分布式数据库实现:无需修改代码,轻松实现分布式能力
本篇文章主要从项目中实际场景出发,讲解分库分表等功能在日常运维中遇到的问题,以及 ShardingSphere-Proxy 对应的解决方案,版本号:v5.1.0。如无特别声明,以下示例中的数据库指 MySQL。...
03月29日[精选文章]浏览:12
-
聊聊大数据spark、strom、hive等使用场景
Spark:拥有Hadoop MapReduce所具有的优点;但不同于MapReduce的是Job中间输出结果可以保存在内存中,从而不再需要读写HDFS,因此Spark能更好地适用于数据挖掘与机器学习等需要迭代的MapReduce的算法。数据过于繁杂,并且需要让计算通过迭代,并在内存中,极大地提高效...
12月18日[精选文章]浏览:18
-
-
-
Hadoop vs Apache Spark 5件事需要了解
讨论大数据的时候,你可能会听到提及Hadoop 和 Apache Spark的话题,这里有一些简单的知识,你需要了解他们之间的不同。...
12月18日[精选文章]浏览:20
-
Apache Doris + Paimon 快速搭建指南|Lakehouse 使用手册(二)
湖仓一体(Data Lakehouse)融合了数据仓库的高性能、实时性以及数据湖的低成本、灵活性等优势,帮助用户更加便捷地满足各种数据处理分析的需求。在过去多个版本中,Apache Doris 持续加深与数据湖的融合,已演进出一套成熟的湖仓一体解决方案。...
12月18日[精选文章]浏览:17
-
AWS推出Apache Airflow全托管工作流MWAA
最近,AWS 推出了亚马逊Apache Airflow托管工作流(MWAA ,这是一项全托管的服务,简化了在 AWS 上运行开源版 Apache Airflow 和构建工作流来执行 ETL 作业和数据管道的工作。Apache Airflow 是一个开源工具,用于通过编程的方式开发、调度和监控被称为“...
12月18日[精选文章]浏览:15
-
linux之lsof详解 linux lsf
lsof命令介绍:lsof(list open files 命令可以列出当前系统已经打开的所有文件。在Linux环境下,任何事物都以文件的形式存在,通过文件不仅仅可以访问常规数据,还可以访问网络连接和硬件。所以如传输控制协议 (TCP 和用户数据报协议 (UDP 套接字等,系统在后台都为该应用程...
12月18日[精选文章]浏览:21