> 文档中心 > 3.4 Spark RDD运行架构

3.4 Spark RDD运行架构

文章目录

  • 基本概念
    • 1、什么是RDD
    • 2、其他概念
  • Spark架构设计
  • Spark运行流程
  • RDD运行原理
    • 1、RDD概念
    • 2、RDD的特性
    • 3、RDD运行过程
  • RDD之间的依赖关系
    • Shuffle操作
  • 阶段的划分
    • Spark join方式
      • Shuffle Hash Join
      • Broadcast Hash Join
      • Sort Merge Join
    • 参考

基本概念