当前位置:首页 > 快讯 > 正文内容

cda(大数据系列之Hadoop的资源管理模块YARN)

wwwnzt88com2年前 (2022-12-11)快讯52

CDA数据分析师 出品

1、 YARN的产生

在之前文章中介绍过hadoop1与hadoop2架构的区别是hadoop2将资源管理功能从MapReduce框架中独立出来,也就是现在的YARN模块。

在没有 YARN 之前,是一个集群一个计算框架。比如:MapReduce 一个集群、Spark 一个集群、HBase 一个集群等。

造成各个集群管理复杂,资源的利用率很低;比如:在某个时间段内 Hadoop 集群忙而Spark 集群闲着,反之亦然,各个集群之间不能共享资源造成集群间资源并不能充分利用。

并且采用"一个框架一个集群"的模式,也需要多个管理员管理这些集群, 进而增加运维成本;而共享集群模式通常需要少数管理员即可完成多个框架的统一管理; 随着数据量的暴增,跨集群间的数据移动不仅需要花费更长的时间,且硬件成本也会大大增加;而共享集群模式可让多种框架共享数据和硬件资源,将大大减少数据移动带来的成本。

解决办法:

将所有的计算框架运行在一个集群中,共享一个集群的资源,按需分配;Hadoop 需要资源就将资源分配给 Hadoop,Spark 需要资源就将资源分配给 Spark,进而整个集群中的资源利用率就高于多个小集群的资源利用率;

2、 YARN的基本构成

Master/Slave 结构,1 个ResourceManager(RM)对应多个 NodeManager(NM);YARN 由 Client、ResourceManager、NodeManager、ApplicationMaster (AM)组成;Client 向 RM 提交任务、杀死任务等;

AM由对应的应用程序完成;

每个应用程序对应一个 AM,AM向RM申请资源用于在NM上启动相应的 Task;NM 向 RM通过心跳信息:汇报 NM健康状况、任务执行状况、领取任务等;

RM:整个集群只有一个,负责集群资源的统一管理和调度

1)处理来自客户端的请求(启动/杀死应用程序);

2)启动/监控 AM;一旦某个 AM 挂了之后,RM 将会在另外一个节点上启动该 AM;

3)监控 NM,接收 NM的心跳汇报信息并分配任务到 NM去执行;一旦某个 NM挂了,标志下该 NM 上的任务,来告诉对应的 AM 如何处理;

4)负责整个集群的资源分配和调度;

NM:整个集群中有多个,负责单节点资源管理和使用

1)周期性向 RM汇报本节点上的资源使用情况和各个 Container 的运行状;

2)接收并处理来自 RM 的 Container 启动/停止的各种命令;

3)处理来自 AM的命令;

4)负责单个节点上的资源管理和任务调度;

AM:每个应用一个,负责应用程序的管理

1)数据切分;

2)为应用程序/作业向 RM 申请资源(Container),并分配给内部任务;

3)与 NM通信以启动/停止任务;

4)任务监控和容错(在任务执行失败时重新为该任务申请资源以重启任务);

5)处理 RM发过来的命令:杀死 Container、让 NM重启等;

Container:对任务运行环境的抽象

1)任务运行资源(节点、内存、CPU);

2)任务启动命令;

3)任务运行环境;任务是运行在Container中,一个Container中既可以运行AM也可以运行具体的 Map/Reduce/MPI/Spark Task;

3、 YARN的工作原理

1)用户向 YARN 中提交应用程序/作业,其中包括 ApplicaitonMaster 程序、启动ApplicationMaster 的命令、用户程序等;

2)ResourceManager 为作业分配第一个 Container,并与对应的 NodeManager 通信,要求它在这个 Containter 中启动该作业的 ApplicationMaster;

3 )ApplicationMaster 首 先 向 ResourceManager 注 册 , 这 样 用 户 可 以 直 接 通 过ResourceManager 查询作业的运行状态;然后它将为各个任务申请资源并监控任务的运行状态,直到运行结束。即重复步骤 4-7;

4)ApplicationMaster 采用轮询的方式通过 RPC 请求向 ResourceManager 申请和领取资源;

5)一旦 ApplicationMaster 申请到资源后,便与对应的 NodeManager 通信,要求它启动任务;

6)NodeManager 启动任务;

7)各个任务通过 RPC 协议向 ApplicationMaster 汇报自己的状态和进度,以让ApplicaitonMaster 随时掌握各个任务的运行状态,从而可以在任务失败时重新启动任务;在作业运行过程中,用户可随时通过 RPC 向 ApplicationMaster 查询作业当前运行状态;

8)作业完成后,ApplicationMaster 向 ResourceManager 注销并关闭自己;

4、 YARN的容错性

ResourceMananger基于 ZooKeeper 实现 HA 避免单点故障;

NodeManager执行失败后,ResourceManager 将失败任务告诉对应的 ApplicationMaster;

由 ApplicationMaster 决定如何处理失败的任务;

ApplicationMaster执行失败后,由 ResourceManager 负责重启;

ApplicationMaster 需处理内部任务的容错问题;

RMAppMaster 会保存已经运行完成的 Task,重启后无需重新运行。

5、 YARN的调度框架

1、双层调度框架

1)ResourceManager 将资源分配给 ApplicationMaster;

2)ApplicationMaster 将资源进一步分配给各个 TASK;

2、基于资源预留的调度策略

1)资源不够时,会为 Task 预留,直到资源充足;描述:当一个 Task 需要 10G 资源时,各个节点都不足 10G,那么就选择一个节点,但是某个 NodeManager上只有 2G, 那么就在这个 NodeManager上预留, 当这个 NodeManager上释放其他资源后,会将资源预留给 10G 的作业,直到攒够 10G 时,启动 Task;缺点:资源利用率不高,要先攒着,等到 10G 才利用,造成集群的资源利用率低;

2)与"all or nothing"策略不同(Apache Mesos)描述:当一个作业需要 10G 资源时,节点都不足 10G,那就慢慢等,等到某个节点上有 10G 空闲资源时再运行,很可能会导致该 Task 饿死。

更多优质内容及精彩资讯,点击【了解更多】进入!

扫描二维码推送至手机访问。

版权声明:本文由小草网发布,如需转载请注明出处。

本文链接:http://www.nzt88.com/58927.html

分享给朋友:

“cda(大数据系列之Hadoop的资源管理模块YARN)” 的相关文章

最美的时光作文600字(我爱这最美的时光作文600字)

最美的时光作文600字(我爱这最美的时光作文600字)

最美的时光作文600题记,小标题时间从手指间匆匆流逝。 天真幼稚的我们现在太年轻了。 不知道忘了多少时间,就这样匆匆长大了。 青春,如梦似幻的青春。 我们随心所欲地疯狂,在我们的世界里疯狂。 在花季中我们,最闪耀的我们。 充满活力和热情,我们可能不再像从前那样天真无知了。 但是,我们还是纯真的。 十...

征求意见表填写内容(以案促改征求意见表填写内容)

家长意见征求表怎样写对学校今后工作的意见和建议:1、希望XX学校成为XX一流的学校。2、如果放学后能推迟到17点就更好了。 我们下班就五点了,确实有点难。 或者,有更晚的让孩子呆的房间。 我想多出点钱,解决这样的困难。3、让我深深感受到学校和老师对孩子们的爱和关怀,我很高兴。 我的选择没有错。 另外...

shampooing(shampooing shampoo)

洗发水英文怎么说?Shampoo/m'pu/洗发水bodywash/bodymilk/showergel沐浴露洗发水的基本功能干净,对病理头屑、脱发等问题完全无能为力,很多“功能”只是商家销售的噱头。 现在购买的洗发水,如果追求头发的柔软性,容易使头发油腻、脏、溃烂。 如果想追求头发的清爽性,头发容...

闲话中国人(易中天闲话中国人)

《闲话中国人》txt全集下载八卦中国人txt全集小说附件上传到百度网盘了。 请单击免费下载:《闲话中国人易中天品读中国系列》epub下载在线阅读,求百度网盘云资源《闲话中国人》 (易中天)电子书网盘下载免费在线阅读资源链接:密码: hgnm书名:八卦中国人作者:易南中豆瓣评分: 7.7出版社:上海文...

五子登科是什么意思(象棋五子登科是什么意思)

五子登科的现代意思是什么五子登科是表示祝福的词,体现了父母望子成龙的美好愿望,常用于结婚时的祝福词和吉祥话。 现代,五子登科多指吉祥图案,也指有“妻、子、家、票、车”的理想生活。五子登科故事《宋史窦仪传》,五代后周朝燕山府有一个叫窦禹钧的人,教儿子们仰慕圣贤努力学习。 此后,他的五个儿子都是品学兼优...

童年趣事200字左右(童年趣事200字左右六年级优美)

童年趣事200字左右(童年趣事200字左右六年级优美)

写一个200字的小作文写童年趣事每次吃西瓜,都会想起小时候做过的傻事,大人们忍不住哭、笑。那是我五岁的时候。 家里还不怎么富裕,没能吃到好东西。 有一次,有人说西瓜很好吃。 果肉又红又甜。 于是我问了妈妈。 “我们家不是有很多( si )‘西瓜’吗? ”西瓜和丝瓜的方言很像,所以妈妈说:“是啊!...

天字配什么字好听(天字配什么字好听有寓意女孩)

天泽名字解释和寓意是什么?天泽对名字的诠释和寓意是胸怀开阔,乐善好施,担当大任。念为天,绾n。 在甲骨文字中最常见,就像站在正面的“人”的形状,用方框突出人头。 义和“一把手”一样。 造字的本义是人的头顶,也代表人头顶无边的苍穹,引出了天空、宇宙等的正义。 与“地”字相反,用作人名,意味着思维开阔、...

竖版中国地图(竖版中国地图与旧版地图的不同)

中国地图的竖版地图2013年1月初,中国地图出版社独家最新竖版中国地形图首次同比例展示南海诸岛,全景展示中国陆海疆域。2014年6月24日,湖南地图出版社与湖北省测绘学会联合编制的竖版《世界地势图》《世界知识地图》,湖南地图出版社独立编制的《中国地势图》《中华人民共和国地图》经国家测绘地理信息局批准...

高难度的字谜(高难度的字谜七则)

谁出个超高难度的字谜,带答案啊236、猜谜:除数为纵,乘方为横,正为生,负结束。 猜字。 答案(变) ) ) ) ) ) )。237、猜谜:不像马,像牛。 是马,不是牛。 猜字。 回答(下午) )238、猜谜: 3横道,1纵道,3人,比赛中奔跑。 猜字。 答案(直径) )239、猜谜:画龟尾收、前留...

赏光是什么意思(赏脸和赏光是什么意思)

赏光和赏脸的区别是什么?主要区别在于释义的不同、基本解释的不同、引文解释的不同,具体如下:一、释义不同这是一句老话,用于邀请对方接受自己的邀请,接受自己的意见。为了给面子,让对方接受请求和礼物而使用。二、基本解释不同请人来的敬语。...

杉山元(杉山元 迈耶)

2战期间日本有哪些大将级军官?-汽车问答-58汽车在东方战场上,小少将石原莞尔竟然和大将杉山元作对,确实让人觉得不可思议,但这也是理所当然的。 首先是因为石原莞尔作为年轻人,并不害怕杉山元。 同时,与杉山元互无条理,杉山元既不能直接命令他什么,也不能惩罚他,甚至石原莞尔拥有的权力,都在杉山元之上。首...

黄金吊(黄金吊水计算公式)

黄金吊坠怎么清洗?自己能清洗吗?怎么清洗?首先谈谈简单的一般清洁护理。 可以用白酒或酒精轻轻擦拭消毒。 通常,这种清洗方式每周清洗一次,夏季每日清洗,擦拭吊坠上的汗水和盐分,在保证个人卫生的同时,保持金坠的清洁。 我们也可以把金子吊在醋里浸一会儿,然后擦干净。 黄金吊坠也可以用盐搓洗。 盐的细小粒子...

玛丽莲梦露死亡之谜

玛丽莲梦露之死,玛丽莲梦露怎么死的第一版:过量服用安眠药1962年8月5日,门罗在美国洛杉矶布兰德沃德公寓的卧室神秘死亡,享年36岁。 当时公布的死因是过量服用安眠药。 但是门罗的才能、美貌和与肯尼迪总统的丑闻给突然的死亡增添了迷雾,很多人相信她死于谋杀。 即使门罗去世50多年,许多关于她的官方调查...

顺桨(螺旋桨顺桨)

风力发电中叶片顺浆什么意思应该为顺桨。就是将叶片的桨距角调整到使得叶片升力很小的状态。一般是使叶片弦线与旋转平面垂直的状态。...

苟利社稷死生以之(苟利社稷死生以之 解析)

根据《左传》的记载,"苟利社稷,生死以之"出自于以下哪一位政治家之口子产:苟利社稷,死生以之“苟利社稷,死生以之”,出自春秋时的政治家子产之口。子产,是郑国的大夫,他在执政期间,贯彻以宽为主、宽猛相济的治国方针,深得民心,他死时,郑国人民悲痛至极,都说:“子产离开了我们,叫我们去...

缀板(缀板重量计算)

钢结构里的缀条、缀板是什么1、钢结构里的缀条是用在格构式柱中,连接格构柱两个分肢的。(联系格构式构件主肢的条形缀件,与主肢翼缘组成桁架体系,使之对承受横向剪力有较大的刚度。多采用型钢(尤其是角钢)。2、如果只用水平板件连接,就是缀板。(每隔一定间距平行放置的联结格构柱分肢的板件。联系格构式构件主肢的...