您现在的位置: 爱51代码网 >> 范文 >> 文章正文
Big Data,Hadoop,MapReduce之间是什么关系

简单描述Big Data,Hadoop,MapReduce之间是什么关系
Bigdata是数据,Mapreduce是模型,Hadoop是实现。
hadoop是云计算中分布式计算的架构,包括文件系统,数据库,zookeeper,mr等等
mapreduce是 分布式计算的一种方式
bigdata是大数据,比如大量结构、非结构化的业务数据,网页,视频,日志等等,现在的大数据我觉得主要是对大数据的处理模式,也就是针对数据的分析挖掘,寻找规律,找出模式。

可以把bigdata想象成一个沙堆,沙堆里有碎碎的金子,以前呢 都是一个人干,一个人慢慢的淘金子淘着淘着就累死了。
自从hadoop来了,hadoop直接找来了很多工人,交给每个工人一份沙子,不一会沙子就分光了。   这个叫hdfs。
hadoop又把如何淘金子的方法告诉了工人们,这样工人们把自己的这份干完后,等待着别人来取沙子的半处理品,交给了一些前来收集沙子的工人。这后一波工人又继续对半成品沙子处理,很快便掏出来了金子。 这个叫mapreduce。
有些细节没有说到,不过大概就这样子吧

  • 上一篇文章:

  • 下一篇文章: 没有了
  • 最新文章 热点文章 相关文章
    linux上的计划定时任务访问一个网
    如何在代码中实现读取dmesg的信息
    i2c-dev.c 与i2c设备驱动有什么关
    Failed to connect to dl-ssl.go
    SharePoint 2013 Search REST AP
    SharePoint如何搜索指定的爬网内
    weblogic Servlet: "action" fai
    webdav 与exchange通信失败未找到
    SharePoint2013文档库可以直接存
    Unable to write data to the tr
    SharePoint 2013 Search REST AP
    SharePoint如何搜索指定的爬网内
    weblogic Servlet: "action" fai
    webdav 与exchange通信失败未找到
    SharePoint2013文档库可以直接存
    Unable to write data to the tr
    asp.net中listbox的items.count属
    C#不是每次查询数据是不是被缓存
    ASP.NET发布后能加载引用的js文件
    Hadoop2.2.0在eclipse控制台没有
    hadoop2.4.0中有hadoop-core
    设计mapreduce计算所有酒店1
    mahout训练出来的分类模型如
    安装cloudera cdh5.2.0后执行
    sqoop数据导出不完整
    hadoop distcp源集群如何识别
    Hadoop2.2.0在eclipse控制台
    windows客户端如何访问hdfs
    yarn.scheduler.fair.locali
    asp中的access年度成绩查询排
     



    设为首页 | 加入收藏 | 网站地图 | 友情链接 |