这是一个程序员的网站,为开发者服务的站点
  • 2.4 HDFS组成架构

    文章目录 计算机集群结构 分布式文件系统的结构 HDFS组成部件 数据块block NameNode与DataNode SecondaryNameNode 参考 2.4 分布式文件系统HDFS组成...

    03-28 43 995 文档中心
  • 2.5 HDFS体系架构

    文章目录 HDFS体系结构概述 HDFS命名空间管理 HDFS通信协议 客户端 HDFS体系结构的局限性 参考 2.4 分布式文件系统HDFS组成架构 2.5 HDFS体系架构 2....

    03-28 44 8 文档中心
  • 2.6 HDFS存储原理

    文章目录 HDFS存储原理 冗余数据保存 数据存取策略 数据错误与恢复 名称节点出错 数据节点出错 数据出错 参考 2.4 分布式文件系统HDFS组成架构 2...

    03-28 31 122 文档中心
  • 2.7 HDFS的使用

    文章目录 启动HDFS HDFS shell操作 ls text mv put rm HDFS shell操作练习 参考 2.4 分布式文件系统HDFS组成架构 2.5 HDFS体系架构 2.6 HDFS存储...

    03-28 34 769 文档中心
  • 2.8 Mapreduce简介与使用

    文章目录 分布式处理框架 MapReduce 什么是MapReduce MapReduce编程模型 Hadoop Streaming 实现wordcount Mapper Reducer 上传文件 得到最终的输出 ...

    03-28 29 432 文档中心
  • 2.9 MRJob编写和运行MapReduce

    文章目录 mrjob mrjob 简介 mrjob 安装 mrjob实现WordCount 运行MRJOB的不同方式 mrjob 实现 topN统计 参考 mrjob mrjob 简介 使用python开发在...

    03-28 31 13 文档中心
  • 2.10 MapReduce文件合并

    文章目录 MRJOB 文件合并 需求描述 mrjob 实现 参考 MRJOB 文件合并 需求描述 两个文件合并 类似于数据库中的两张表合并 uid uname01 user1 02 use...

    03-28 32 837 文档中心
  • 2.11 MapReduce原理

    2.11 MapReduce原理

    文章目录 MapReduce原理 MapReduce架构 参考 MapReduce原理 单机程序计算流程 输入数据—>读取数据—>处理数据—>写入数据—>输出数据 Hadoo...

    03-28 11 558 文档中心
  • 3.1 Hadoop架构

    文章目录 Hadoop的优化与发展 Hadoop的局限与不足 Hadoop的改进与提升 HDFS2.0的新特性 HDFS HA HDFS Federation 资源管理调度框架YARN MapRedu...

    03-28 35 958 文档中心
  • 3.2 Hadoop生态

    3.2 Hadoop生态

    文章目录 Hadoop生态系统 Hadoop生态系统中具有代表性的功能组件 Pig Tez Spark Kafka 参考 Hadoop生态系统 狭义的Hadoop VS 广义的Hadoop 广义的Ha...

    03-28 47 312 文档中心