大数据架构
大数据架构处理PB级数据的存储、计算和分析。
目录
大数据技术栈
┌────────────────────────────────────────────────────┐
│ 大数据技术栈 │
├────────────────────────────────────────────────────┤
│ 数据采集 Flume、Kafka、Logstash │
│ 数据存储 HDFS、S3、HBase、Cassandra │
│ 批处理 Hadoop MR、Spark、Flink │
│ 流处理 Flink、Storm、Spark Streaming │
│ 查询引擎 Hive、Presto、ClickHouse │
│ 调度 Airflow、Oozie │
└────────────────────────────────────────────────────┘开始学习 → 01_batch_processing.md
💬 讨论
使用 GitHub 账号登录后即可参与讨论