(译文)Cloudera、Hortonworks 和 MapR —— Hadoop商业发行版的对比分析_akityou的博客-CSDN博客


本站和网页 https://blog.csdn.net/akityou/article/details/62423003 的作者无关,不对其内容负责。快照谨为网络故障时之索引,不代表被搜索网站的即时页面。

(译文)Cloudera、Hortonworks 和 MapR —— Hadoop商业发行版的对比分析_akityou的博客-CSDN博客
(译文)Cloudera、Hortonworks 和 MapR —— Hadoop商业发行版的对比分析
akityou
于 2017-03-16 14:47:15 发布
4416
收藏
分类专栏:
大数据平台
版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/akityou/article/details/62423003
版权
大数据平台
专栏收录该内容
1 篇文章
0 订阅
订阅专栏
原文:https://www.dezyre.com/article/cloudera-vs-hortonworks-vs-mapr-hadoop-distribution-comparison-/190
对于企业而言,不管过去是否曾使用过Hadoop,正确选择Hadoop商业发行版都很重要。当企业准备投入巨大的财力在Hadoop平台的硬件和解决方案上时,选择某个商业版的Hadoop系统就变得特别重要了。根据业务需要选择正确的Hadoop商业发行版可以带来更多的数据解决方案并且可以获得业界专业人士的认可。这篇文章将从成本、技术细节、部署和维护等几个方面比较Cloudera、Hortonworks和MapR发布的Hadoop版本。
Hadoop 是一个开源项目,先后有许多公司在其框架基础上进行了增强并且发布了商业版本。Hadoop项目的最大诱惑在于使用者可以根据自身的业务需要定制差异化的功能。在Apache开源社区,Hadoop把所有的相关项目组成一个完整的生态系统,用户几乎不费吹灰之力就可以通过搭配一些组件来实现一个完整功能。
哪些人需要Hadoop分布式系统?
l 需要学习和临时使用Hadoop的各行业专业人士
l 需要在大数据的背景下推进业务解决方案演进的各类机构
l 需要在Hadoop生态系统中开发新工具的人员
商业版本的Hadoop有哪些改进?
Hadoop商业发行版的提供者们通过优化核心代码、增强易用性、提供技术支持和持续版本升级为Hadoop平台实现了许多新功能。市场上受认可的Hadoop商业发行版的提供者主要有Cloudera,MapR和Hortonworks。 他们发行的Hadoop商业版本都能与Apache社区开源版本兼容,但它们之间有哪些区别呢?
l 框架核心:Cloudera,MapR和Hortonworks这三家公司都把Hadoop核心框架打包到了他们的商业版本中;在这基础上,他们都提供了技术支持服务和定制化开发服务。
l 系统集成:MapR 的商业版Hadoop可靠地支持一系列功能,包括:实时流数据处理,与已有系统集成的内嵌的连接器,数据安全保护,企业级工程品质。
l 系统管控:Cloudera和MapR 商业发行版中都包含了为系统管理员提供了配置、监控和优化的管控平台。
Cloudera,Hortonworks和MapR异同之处分析
版本 优点 缺点 CDH CDH有一个友好的用户界面及一些实用的工具,比如:Impala CDH相对MapR Hadoop来说,运行效率显著降低 MapR Hadoop 运行效率高;节点之间可以通过NFS直接访问 MapR Hadoop没有像CDH那样的用户界面 HDP 唯一一个能运行在Windows上的Haoop系统 Ambari管控界面功能比较简单,不够丰富
相似性:
l Cloudera, Hortonworks 和MapR三家公司都专注于Hadoop平台开发,商业版本的Hadoop系统是他们的全部收入来源。
l 这三家公司都是中等规模的公司,都拥有一些优质客户和来自其他行业的投资伙伴。
l 这三家公司都提供了免费版本的下载,不同的是,MapR和Cloudera 还为付费客户提供功能增强版本。
l 这三家公司都建立了技术支持社区帮助用户解决遇到的问题以及在用户需要时提供系统演示。
l 这三家公司都通过测试保证发行版本满足用户业务对稳定性和安全性需求。
下面我们会在对比每一个商业版本功能的基础上分析其差异性:
Cloudera — CDH
Cloudera 是Hadoop领域知名的公司和市场领导者,提供了市场上第一个Hadoop商业发行版本。它拥有350多个客户并且活跃于Hadoop生态系统开源社区。在多个创新工具的贡献着排行榜中,它都名列榜首。它的系统管控平台——Cloudera Manager,易于使用、界面清晰,拥有丰富的信息内容。Cloudera 专属的集群管控套件能自动化安装部署集群并且提供了许多有用的功能,比如:实时显示节点个数,缩短部署时间等。同时,Cloudera 也提供咨询服务来解决各类机构关于在数据管理方案中如何使用Hadoop技术以及开源社区有哪些新内容等疑虑。美国电商“高朋”公司是CDH的用户。
CDH的主要特性:
l 在线不停机添加新组件
l 多集群统一管理
l 提供差异化配置的节点模板。用户不必使用单一配置的Hadoop集群,可以依此创建差异化配置的集群。
l Hortonworks 和Cloudera都依赖于HDFS的DataNode 和NameNode架构来做数据切分。 
MapR — Hadoop
MapR的Hadoop商业发行版紧盯市场需求,能更快反应市场需要。一些行业巨头如思科、埃森哲、波音、谷歌、亚马逊都是MapR的Hadoop的用户。与Cloudera和Hortonworks不同的是, MapR Hadoop不依赖于Linux文件系统,也不依赖于HDFS,而是在MapRFS文件系统上把元数据保存在计算节点,快速进行数据的存储和处理。
MapR Hadoop的主要特性:
l 由于它基于MapRFS,它是唯一一个能不依赖于Java而提供Pig,Hive和Sqoop的Hadoop。
l MapR Hadoop是最适合应用于生产环境的Hadoop版本,它包含了许多易用性、高效和可信赖的增强功能。
l MapR Hadoop集群节点可以通过NFS直接访问,因此用户可以像使用Linux文件系统一样在NFS上直接挂载MapR文件。
l MapR Hadoop提供了完整的数据保护,方便使用并且没有单点故障。
l MapR Hadoop被认为是运行最快的Hadoop版本。
尽管从集群规模来说,MapR Hadoop还不如Hortonworks 和Cloudera,只能暂列第三,但相对其它版本的Hadoop来说,它易用性最强,运行最快。因此,如果用户想选择带有足够创意和学习资料的Hadoop,那么MapR Hadoop将是不二之选。
Hortonworks — HDP
Hortonworks是由一些雅虎的工程师创立的公司,提供针对Hadoop的技术服务。与其它公司不同的是,它提供完全开源的Hadoop数据平台并且用户可以免费使用。用户可以很方便得下载Hortonworks 的Hadoop发行版HDP并把它集成到各种应用中。Ebay、三星、彭博、Spotify 都是HDP的用户。Hortonworks 也是第一个基于Hadoop 2.0提供满足生产环境需要的Hadoop版本。尽管CDH在其早期的版本中包含了Hadoop 2.0的部分功能,但这些功能无法满足生产环境需要。HDP 也是目前唯一能支持Windows的Hadoop版本。用户可以在Azure 上通过HDInsight 服务部署Windows上的 Hadoop。
HDP的主要特性:
l HDP 通过Stinger项目提升了Hive的性能
l HDP 通过新的Hadoop分支来避免用户被厂商绑定
l 聚焦于提升Hadoop平台的实用性
通过对Hadoop市场上的这三家公司的产品战略和功能分析后,我们很难简单说谁更胜一筹。各类机构需要根据自身业务程度需要来选择Hadoop商业版本。回答下面这些问题可以帮助用户做出选择:
1.        是否会使系统管理员工作更加高效?
2.        是否便于Hadoop开发人员和业务分析人员访问数据?
3.        是否满足机构内部关于数据安全的规章制度要求?
4.        是否适合机构内部的系统运行环境?
5.        是否需要Hadoop提供的所有组件和能力?
6.        是否需要大数据的整体解决方案来支撑业务盈利?以及是否需要紧跟开源以减少被厂商绑定?
7.        系统可靠性、技术支持、扩展功能等是否非常重要?
用户如果期望得到一个像样的产品,那选择MapR Hadoop比较适合;如果需要紧跟开源,那么就应该选择Hortonworks;如果用户的业务需求需要介于二者之间,那么Cloudera 就是个不错的选择了。
如何选择Hadoop发行版完全取决于用户在实施Hadoop平台中遇到了什么样的困难。Hadoop商业发行版可以帮助用户把Hadoop平台和其他异构数据分析平台灵活、可靠、可视化地连接起来。每个Hadoop发行版都有其各自的优点和缺点。在选择时,不仅要平衡风险和成本,也要考虑各种发行版的附加功能是否符合实际业务场景需要。
Akityou 2016
akityou
关注
关注
点赞
收藏
打赏
评论
(译文)Cloudera、Hortonworks 和 MapR —— Hadoop商业发行版的对比分析
原文:https://www.dezyre.com/article/cloudera-vs-hortonworks-vs-mapr-hadoop-distribution-comparison-/190对于企业而言,不管过去是否曾使用过Hadoop,正确选择Hadoop商业发行版都很重要。当企业准备投入巨大的财力在Hadoop平台的硬件和解决方案上时,选择某个商业版的Hadoop系统就
复制链接
扫一扫
专栏目录
HDP破解版+去限制
09-08
仅支持盒子和安卓电视!
不支持安卓手机和安卓模拟器
最好用的直播电视HDP3.1.1纯净版
03-31
大神破解版,可以用在智能电视上,删掉了所有的购物直播频道。
参与评论
您还未登录,请先
登录
后发表或查看评论
Apache 、CDH、TDH、HDP、MapR等Hadoop版本区别
清平乐的技术专栏
03-17
3385
目前在中国流行的是apache hadoop,Cloudera CDH,当然Hortonworks也有用的
apache hadoop则是原生的hadoop。
Cloudera有免费版和企业版,企业版只有试用期。
Hortonworks Hadoop区别于其他的Hadoop发行版(如Cloudera)的根本就在于,Hortonworks的产品均是百分之百开源。
Apache Ambari是一个基于...
CDH 的Cloudera Manager免费与收费版的对比表
TURING.DT
04-13
7588
CDH 特性
免费版
付费版
Deployment, Configuration & Management
系统管理
Hadoop 王者 Cloudera 新转型,定位为混合数据公司
最新发布
CSDN云计算
09-25
398
随着 AI 等技术兴起,对于数据的应用分析受到了越来越多的重视,数据赛道热度也持续火热。大数据时代为企业提供 Hadoop 服务的 Cloudera,也推出了新一代数据平台 CDP,并逐渐替代以往的大数据平台 CDH 和 HDP。最近,CSDN 再次采访了 Cloudera 大中华区技术总监刘隶放,听听 Cloudera 对于云时代下,数据应用的新趋势的观察与经验。
Hadoop各商业发行版之比较
lionzl的专栏
06-27
792
Hadoop各商业发行版之比较
时间 2013-11-07 08:04:54 ITeye-博客
原文 http://yangshangchuan.iteye.com/blog/1972846
主题 Hadoop
Hadoop 的发行版除了社区的 Apache Hadoop 外, Cloudera , Hortonworks ,MapR , EMC , IB
Hadoop之 MapReducer工作过程
weixin_34319640的博客
11-12
77
1. 从输入到输出
一个MapReducer作业经过了input,map,combine,reduce,output五个阶段,其中combine阶段并不一定发生,map输出的中间结果被分到reduce的过程成为shuffle(数据清洗)。
在shuffle阶段还会发生copy(复制)和sort(排序)。
在MapReduce的过程中,一个作业被分成Ma...
大数据应用,Hadoop发行版各显神通
weixin_30919429的博客
08-16
79
本文综合了Hortonworks、Cloudera、MapR三家主要的Hadoop发行版供应商的Hadoop应用案例,真是各有神通,不服来辩。
Cloudera:加速数据分析
Edo Interactive是一家美国市场营销公司,帮助广告主连接线上广告和线下数据,提供数据驱动的个性化推荐服务。不过几年前,Edo遇到了这样的问题:数据仓库系统处理信用卡交易数据耗时长,不能满足公司向消费者和餐馆进...
Cloudera CDH 、Hortonworks DHP和MapR比较
weixin_33728268的博客
08-13
912
2019独角兽企业重金招聘Python工程师标准>>>
...
Hadoop发行:Cloudera vs Hortonworks - 哪一个更好?
happyfreeangel的博客
03-04
4637
Hadoop发行:Cloudera vs Hortonworks - 哪一个更好?
cloudera,hadoop认证,hortonworks 14331 0 Natasha 24/05/2017大数据已经成为一种流行语,几乎成为包含大多数行业的所有业务的常态。随着大数据席卷整个行业,领先的企业正在寻找更简单有效的方法来分析和利用大量数据。当然,强大的开源软件框架Apache Hadoop是救世...
Apache Hadoop、CDH、HDP、MapR区别
feng12345zi的博客
10-11
5667
一、简述
目前Hadoop的发行版除了Apache的开源版本之外,还有华为发行版、Intel发行版、Cloudera发行版(CDH)、Hortonworks发行版(HDP)、MapR等,所有这些发行版均是基于Apache Hadoop衍生出来的,因为Apache Hadoop的开源协议允许任何人对其进行修改并作为开源或者商业产品发布。国内大多数公司发行版是收费的,比如Intel发行版、华为发行版...
hadooop篇一-入门(配置及架构了解)
smsmtiger的博客
11-29
1792
1.hadoop框架
1.1 Hadoop是什么
1.2 Hadoop发展历史
1.3Hadoop三大发行版本
Hadoop三大发行版本:Apache、Cloudera、Hortonworks。
Apache版本最原始(最基础)的版本,对于入门学习最好。
Cloudera在大型互联网企业中用的较多。
Hortonworks文档较好。
1.Apache Hadoop
官网地址:http://h...
MapR 架构、设计、实现分析
DenzilXu的专栏
11-22
2810
1、MapR是什么
在大数据这个潜力无比的新兴市场中,Hadoop无疑已经提前卡位成功。 在Hadoop的基础上,人们纷纷推出了自己的发行版和增值服务,比如Cloudera推出了CDH;IBM则推出了InfoSphere BigInsights;Yahoo更是将原来开发Hadoop的部分独立拆分出来成立了一家新公司Hortonworks。MarR与上述类似,它是2009年注册
Mapr 安装hadoop的组件(十一)——安装Whirr
maoxiao_jsd的专栏
12-30
679
阿帕奇呼呼™是一套用于运行云服务的图书馆。呼呼规定:
云无关的方式来运行服务。您不必担心每个供应商的特质。一个常见的​​服务API。配置细节都特别的服务。聪明的默认服务。你可以得到一个正确配置的系统快速运行,同时仍然能够根据需要重写设置。
您还可以使用呼呼作为一个命令行工具,用于部署集群。
安装呼呼
以下过程使用的操作系统软件包管理器,从MAPR存储库下载安装。要手动安装软件包,请
HPE和MapR:Hadoop过多,云不足
cxt70571的博客
05-20
159
云扼杀了 Hadoop三位一体的命运 -Cloudera,Hortonworks和MapR-相同的云可能不会使HPE成功,后者最近收购了MapR的业务资产。 虽然该交易承诺将“ MapR在人工智能和机器学习(AI / ML)以及分析数据管理中的技术,知识产权和领域专业知识”与HPE的“智能数据平台功能”结合起来,但该交易没有一个因素两家公司最需要的是:云。
换句话说,问题不在于Wikibo...
为什么商业Hadoop实现最适合用于企业部署
Enweitech Software Works
12-02
1035
摘要:MapReduce 实现是希望分析静止大数据的企业的首选技术。企业可以选择使用单纯的开源 MapReduce 实现(最著名的就是 Apache Hadoop),也可以选择使用商业实现。在这里,作者证明了以下情形:基于 Hadoop 的产品(比如 InfoSphere BigInsights™)比
分析是所有企业大数据部署的核心。关系数据库仍然是运行事务性应用程序的最
企业级三大hadoop-Cloudera、Hortonworks和MapR
u012749168的博客
10-09
9109
转载地址:
http://wenku.baidu.com/link?url=x9xRWvuZuUMFKgN9McNY4DSAGXCi3dlUFMtnDE-Lg39_VeOUgUkm9L_1M4g1JID6vtVxO8jfvizkmZADdlpuEOo5ICEF_M92Eo9uB2fhmE_
http://business.sohu.com/20160919/n468669356.shtml
MapR浅析
michael_zhu_2004的专栏
11-27
3805
1. 天上掉下个MapR
MapR成立于2009年,但是引起媒体广泛关注是缘由GIGAOM网站2011年3月的一篇报道 《MapR,Cloudera的新对手》(http://gigaom.com/cloud/meet-mapr-a-competitor-to-hadoop-leader-cloudera/),报道这么描述MapR:
“构建一个HDFS的私有替代品,这个替代品比当前的开源版本快三
初识Mapr(三)——规划集群
maoxiao_jsd的专栏
12-30
2994
一个MAPR Hadoop的安装通常是一个大型的集单个主机,称为节点,统称为集群。在一个典型的群集,大多数(或全部)的节点专用于数据处理和存储,以及节点的数目较少运行的其他服务,提供集群协调和管理。在部署MAPR的第一步是规划的节点将有助于集群,并选择将运行在每个节点上的服务。
首先,规划哪些计算机将作为节点在MAPR Hadoop集群和哪些具体的服务(守护进程)将运行在每个节点上。要确定计算机
深入理解与应用Hadoop中的MapReduce
热门推荐
什么最重要?算法!!
11-28
1万+
现在大数据是越来越火了,而我自己研究这方面也很长时间了,今天就根据我自己的经验教会大家玩转MapReduce,下文中将MapReduce简写为MR。
本篇博客将结合实际案例来具体说明MR的每一个知识点。1、本篇博客核心内容:2、MR的基本概念3、MR中map()函数和reduce()函数如何编写4、MR程序的基本编写流程(MR的基本执行过程)
下面将用一个具体的电信业务说明MR最基本的编写
“相关推荐”对你有帮助么?
非常没帮助
没帮助
一般
有帮助
非常有帮助
提交
©️2022 CSDN
皮肤主题:大白
设计师:CSDN官方博客
返回首页
akityou
CSDN认证博客专家
CSDN认证企业博客
码龄8年
暂无认证
原创
69万+
周排名
197万+
总排名
4416
访问
等级
55
积分
粉丝
获赞
评论
收藏
私信
关注
热门文章
(译文)Cloudera、Hortonworks 和 MapR —— Hadoop商业发行版的对比分析
4416
分类专栏
大数据平台
1篇
您愿意向朋友推荐“博客详情页”吗?
强烈不推荐
不推荐
一般般
推荐
强烈推荐
提交
最新文章
2017年1篇
目录
目录
分类专栏
大数据平台
1篇
目录
评论
被折叠的 条评论
为什么被折叠?
到【灌水乐园】发言
查看更多评论
打赏作者
akityou
你的鼓励将是我创作的最大动力
¥2
¥4
¥6
¥10
¥20
输入1-500的整数
余额支付
(余额:-- )
扫码支付
扫码支付:¥2
获取中
扫码支付
您的余额不足,请更换扫码支付或充值
打赏作者
实付元
使用余额支付
点击重新获取
扫码支付
钱包余额
抵扣说明:
1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。 2.余额无法直接购买下载,可以购买VIP、C币套餐、付费专栏及课程。
余额充值