文章目录
- mrjob
-
- mrjob 简介
- mrjob 安装
- mrjob实现WordCount
- 运行MRJOB的不同方式
-
mrjob
mrjob 简介
- 使用python开发在Hadoop上运行的程序, mrjob是最简单的方式
- mrjob程序可以在本地测试运行也可以部署到Hadoop集群上运行
- 如果不想成为hadoop专家, 但是需要利用Hadoop写MapReduce代码,mrJob是很好的选择
mrjob 安装
mrjob实现WordCount
from mrjob.job import MRJob