注意,配置这些参数前,应充分理解这几个参数的含义,以防止误配给集群带来的隐患。另外,这些参数均需要在yarn-site.xml中配置。

留意,装备这些参数前,应充沛了解这几个参数的意义,以避免误配给集群带来的危险。别的,这些参数均需要在YARN-site.xml中装备。

Hadoop YARN装备参数分析(1)—RM与NM相关参数(hadoop中的yarn)  YARN 第1张

1. ResourceManager相关装备参数

(1) yarn.resourcemanager.address

参数解说:ResourceManager 对客户端露出的地址。客户端经过该地址向RM提交应用程序,杀死应用程序等。

默认值:${yarn.resourcemanager.hostname}:8032

(2) yarn.resourcemanager.scheduler.address

参数解说:ResourceManager 对ApplicationMaster露出的拜访地址。ApplicationMaster经过该地址向RM恳求资源、开释资源等。

默认值:${yarn.resourcemanager.hostname}:8030

(3) yarn.resourcemanager.resource-tracker.address

参数解说:ResourceManager 对NodeManager露出的地址.。NodeManager经过该地址向RM报告心跳,收取使命等。

默认值:${yarn.resourcemanager.hostname}:8031

(4) yarn.resourcemanager.admin.address

参数解说:ResourceManager 对办理员露出的拜访地址。办理员经过该地址向RM发送办理指令等。

默认值:${yarn.resourcemanager.hostname}:8033

(5) yarn.resourcemanager.webapp.address

参数解说:ResourceManager对外web ui地址。用户可经过该地址在浏览器中检查集群各类信息。

默认值:${yarn.resourcemanager.hostname}:8088

(6) yarn.resourcemanager.scheduler.class

参数解说:启用的资源调度器主类。现在可用的有FIFO、Capacity Scheduler和Fair Scheduler。

默认值:

org.apache.Hadoop.yarn.server.resourcemanager.scheduler.capacity.CapacityScheduler

(7) yarn.resourcemanager.resource-tracker.client.thread-count

参数解说:处理来自NodeManager的RPC恳求的Handler数目。

默认值:50

(8) yarn.resourcemanager.scheduler.client.thread-count

参数解说:处理来自ApplicationMaster的RPC恳求的Handler数目。

默认值:50

(9) yarn.scheduler.minimum-allocation-mb/ yarn.scheduler.maximum-allocation-mb

参数解说:单个可恳求的最小/***内存资源量。比方设置为1024和3072,则运转MapRedce作业时,每个Task最少可恳求1024MB内存,最多可恳求3072MB内存。

默认值:1024/8192

(10) yarn.scheduler.minimum-allocation-vcores / yarn.scheduler.maximum-allocation-vcores

参数解说:单个可恳求的最小/***虚拟CPU个数。比方设置为1和4,则运转MapRedce作业时,每个Task最少可恳求1个虚拟CPU,最多可恳求4个虚拟CPU。什么是虚拟CPU,可阅览我的这篇文章:“YARN 资源调度器分析”。

默认值:1/32

(11) yarn.resourcemanager.nodes.include-path /yarn.resourcemanager.nodes.exclude-path

参数解说:NodeManager是非名单。假如发现若干个NodeManager存在问题,比方故障率很高,使命运转失败率高,则能够将之参加黑名单中。留意,这两个装备参数能够动态收效。(调用一个refresh指令即可)

默认值:“”

(12) yarn.resourcemanager.nodemanagers.heartbeat-interval-ms

参数解说:NodeManager心跳距离

默认值:1000(毫秒)

2. NodeManager相关装备参数

(1) yarn.nodemanager.resource.memory-mb

参数解说:NodeManager总的可用物理内存。留意,该参数是不行修正的,一旦设置,整个运转过程中不 可动态修正。别的,该参数的默认值是8192MB,即便你的机器内存不行8192MB,YARN也会依照这些内存来运用(傻不傻?),因而,这个值经过一 定要装备。不过,Apache现已正在测验将该参数做成可动态修正的。

默认值:8192

(2) yarn.nodemanager.vmem-pmem-ratio

参数解说:每运用1MB物理内存,最多可用的虚拟内存数。

默认值:2.1

(3) yarn.nodemanager.resource.cpu-vcores

参数解说:NodeManager总的可用虚拟CPU个数。

默认值:8

(4) yarn.nodemanager.local-dirs

参数解说:中心成果寄存方位,类似于1.0中的mapred.local.dir。留意,这个参数通常会装备多个目录,已分摊磁盘IO负载。

默认值:${hadoop.tmp.dir}/nm-local-dir

(5) yarn.nodemanager.log-dirs

参数解说:日志寄存地址(可装备多个目录)。

默认值:${yarn.log.dir}/userlogs

(6) yarn.nodemanager.log.retain-seconds

参数解说:NodeManager上日志最多寄存时刻(不启用日志集合功用时有用)。

默认值:10800(3小时)

(7) yarn.nodemanager.aux-services

参数解说:NodeManager上运转的隶属服务。需装备成mapreduce_shuffle,才可运转MapReduce程序

默认值:“”

原文链接:http://dongxicheng.org/mapreduce-nextgen/hadoop-yarn-configurations-resourcemanager-nodemanager/

转载请说明出处
知优网 » Hadoop YARN装备参数分析(1)—RM与NM相关参数(hadoop中的yarn)

发表评论

您需要后才能发表评论