简单描述Big Data,Hadoop,MapReduce之间是什么关系 Bigdata是数据,Mapreduce是模型,Hadoop是实现。 hadoop是云计算中分布式计算的架构,包括文件系统,数据库,zookeeper,mr等等 mapreduce是 分布式计算的一种方式 bigdata是大数据,比如大量结构、非结构化的业务数据,网页,视频,日志等等,现在的大数据我觉得主要是对大数据的处理模式,也就是针对数据的分析挖掘,寻找规律,找出模式。
可以把bigdata想象成一个沙堆,沙堆里有碎碎的金子,以前呢 都是一个人干,一个人慢慢的淘金子淘着淘着就累死了。 自从hadoop来了,hadoop直接找来了很多工人,交给每个工人一份沙子,不一会沙子就分光了。 这个叫hdfs。 hadoop又把如何淘金子的方法告诉了工人们,这样工人们把自己的这份干完后,等待着别人来取沙子的半处理品,交给了一些前来收集沙子的工人。这后一波工人又继续对半成品沙子处理,很快便掏出来了金子。 这个叫mapreduce。 有些细节没有说到,不过大概就这样子吧
|