Hadoop中文题

Hadoop中文题

这些 Hadup 选择题和答案将帮助您更好地了解 Hadup。 通过 100 多个 Hadoop MCQ 为您的下一次考试或面试做准备。
向下滚动以从答案开始。

1: 以下哪项是用于设置Hadoop WebHDFS REST API中现有文件的命令的正确语法?

A.   setReplication(字符串复制,路径P,fspermission权限)

B.   SetReplication(FSPermission许可,简短复制)

C.   setReplication(字符串复制,路径P)

D.   setReplication(路径SRC,短复制)

2: 在猪中,可以使用复制的联接可以执行以下哪种连接操作?

A.   只有i)和ii)

B.   只有ii)和iii)

C.   只有i)和iv)

D.   只有iii)和iv)

E.   只有i),ii)和iii)

3: 以下哪项是接受客户端的作业提交并安排任务以运行工人节点的主题?

A.   任务跟踪器

B.   JobTracker

C.   纱

D.   节点管理器

4: 以下哪个环境变量用于确定猪的Hadoop群集以运行MapReduce作业?

A.   yarn_conf_dir

B.   hadoop_prefix

C.   hadoop_conf_dir

D.   hadoop_home

5: 以下哪个HDFS命令用于检查各种文件的不一致和报告问题?

A.   fetchdt

B.   DFS

C.   oiv

D.   FSCK

6: 以下哪个命令用于查看名为 /newexample/example1.txt的文件的内容?

A.   bin/hdfs dfs -cat/newexample/example1.txt

B.   bin/hadoop dfsadmin -ddir/newexample/example1.txt

C.   bin/hadoop dfs -cat/newexample/example1.txt

D.   bin/hdfs dfsadmin -ddir/newexample/example1.txt

7: 在Hadoop架构中,以下哪个组件负责计划和执行单个工作?

A.   资源管理器

B.   节点管理器

C.   应用程序主

D.   容器

8: 以下哪个接口用于访问Hive Metastore?

A.   转换

B.   命令行

C.   Objectinspector

D.   节俭

9: 以下hadoop命令的功能是什么?

A.   它显示文件长度的摘要。

B.   如果文件为文件,则显示文件的长度,而在目录的情况下,它显示该目录中存在的文件和目录的大小。

C.   它显示特定目录中的文件数。

D.   它显示特定目录中存在的文件的数字和名称。

10: 在Hadoop中,为以下原因拍摄了HDFS快照吗?i)提供防止用户错误的保护。

A.   只有i)和iii)

B.   只有ii)和iv)

C.   只有i),ii)和iii)

D.   只有i),iii)和iv)

E.   所有i),ii),iii)和iv)

11: 在插入磁盘之前,MAP任务发出的中间输出记录使用圆形缓冲区在本地内存中进行缓冲。以下哪个属性用于配置此圆形缓冲区的大小?

A.   mapReduce.task.io.sort.mb

B.   io.record.sort.percent

C.   MapReduce.Partitioner.Class

D.   mapReduce.task.io.mb

12: 以下哪些接口可以通过接受块中的输入来减少UDF所需的内存量?

A.   五核试验器界面

B.   仓库界面

C.   FilterFunc接口

D.   累加器接口

13: 应使用以下哪个Hive子句在查询结果上施加总订单?

A.   订购

B.   排序方式

C.   A或B

D.   以上都不是

14: 以下哪个Hive命令用于创建名为MyData的数据库?

A.   创建MyData数据库

B.   创建数据库mydata

C.   创建新的myData数据库

D.   创建新数据库mydata

15: 以下hadoop命令的函数是哪个给定选项?-a

A.   它用于检查是否所有库可用。

B.   它用于扩展通配符。

C.   它用于指定资源管理器。

D.   它用于为属性分配值

16: 在以下哪种猪执行模式中,Java程序能够通过导入猪库来调用猪命令?

A.   交互式模式

B.   批处理模式

C.   嵌入式模式

D.   交互式或批处理模式

17: 哪个给定的猪数据类型具有以下特征?

A.   Bytearray

B.   包

C.   地图

D.   元组

18: 纱线体系结构中资源管理器的调度程序执行以下哪项功能?

A.   它提供了有关应用程序状态的见解。

B.   它可以保证重新启动应用程序和硬件故障。

C.   它将资源分配给集群中运行的应用程序。

D.   它处理客户提交的应用程序。

19: 以下哪个是猪联盟操作员的特征?

A.   它没有对要连接的两个数据集的模式施加任何限制。

B.   它在串联数据集时删除了重复的元组。

C.   它在串联数据集时保留了元组的排序。

D.   它使用Onschema预选赛为结果提供架构

20: 以下哪个操作员必须用于theta-join?

A.   cogroup

B.   foreach

C.   叉

D.   联盟

21: Hadoop流命令的正确行命令语法是以下哪个?

A.   hadoop命令[流媒体]

B.   命令〜hadoop [genericoptions] [流媒体]

C.   hadoop命令[genericoptions] [streamoptions]

D.   命令〜hadoop [流媒体] [genericoptions]

22: 以下哪个陈述对蜂巢连接是正确的?

A.   蜂巢中的连接是可交易的。

B.   在Hive中,可以连接两个以上的桌子。

C.   默认情况下,参与加入的第一个表被流式传输到减少任务。

D.   全部正确。

23: 以下哪项用于更改文件组?

A.   HDFS CHGRP [所有者] [:[group]] [-r]< filepath>< newgroup>

B.   HDFS CHGRP [-r]< group> < filepath>

C.   HDFS CHGRP [-r]< [group [:[anesly]> < filepath>

D.   HDFS CHGRP< group> < filepath> [ - r]< newgroup>

E.   hdfs chgrp< group> [ - r]< newgroup>

24: 假设您需要选择一个支持资源管理器高可用性(RM HA)的存储系统。在这种情况下,应选择以下哪种存储?

A.   基于LevelDB的州店

B.   基于文件系统的状态商店

C.   基于Zookeeper的州店

D.   选项A或B可以使用

25: 关于Hadoop文件系统名称空间,以下哪个语句是正确的?

A.   HDFS未实现用户访问权限。

B.   在HDF中,不允许用户创建目录。

C.   HDFS支持硬链接。

D.   HDFS实现用户配额。

26: 以下哪个Hadoop命令用于创建零长度的文件?

A.   触摸

B.   尾巴

C.   文本

D.   测试

27: 考虑一个名为abc.dat.txt的输入文件,默认块大小128 MB。以下哪项是正确的命令,它将该文件上传到HDFS,块大小为512 MB?

A.   hadoop fs〜d块= 536870912 -put abc.dat.txt to abc.dat.newblock.txt

B.   hadoop fs.blocksize = 536870912 -put abc.dat.txt abc.dat.newblock.txt

C.   hadoop fs -d dfs.blocksize = 536870912 -put abc.dat.txt abc.dat.newblock.txt

D.   hadoop fs.blocksize -d = 536870912 -put abc.dat.txt to abc.dat.newblock.txt

28: 纱线资源管理器的以下配置属性的功能是什么?yarn.resourcemanager.ha.id

A.   它用于识别客户使用的类。

B.   它用于列出资源管理人员使用的逻辑ID。

C.   它用于为资源管理器指定相应的主机名。

D.   它用于在集合中识别资源管理器。

29: MapReduce和传统RDBM之间的正确差异是以下哪两个?

A.   MapReduce中的缩放是非线性的,而在RDBMS中是线性的。

B.   在MapReduce中,可以多次执行读取操作,但只能执行一次写操作。在传统的RDBM中,可以多次执行读写操作。

C.   与RDBM相比,MapReduce的完整性更高。

D.   MapReduce的访问模式是批处理,而RDBMS的访问模式是互动的和批次

30: 关于纱线Web应用程序代理,以下哪个语句正确?

A.   它可以防止应用程序管理器提供与恶意外部站点的链接。

B.   它可以防止执行恶意JavaScript代码。

C.   它从用户中剥离了cookie,并用单个cookie代替了它们,并提供了登录用户的用户名。

D.   它作为资源管理器的一部分运行,但不能配置为在独立模式下运行。

31: Hadoop流命令的以下两个参数是可选的?

A.   -Output DirectoryName

B.   -cmdenv name = value

C.   -combiner streamcommand

D.   - 降低javaclassname

32: 以下哪个命令用于在流命令中设置环境变量?

A.   -file abc =/home/示例/

B.   -mapper abc =/home/inputReader/example/dictionaries/

C.   - 输入abc =/home/directories/示例

D.   -cmdenv abc =/home/example/dictionaries/

33: HDFS中磁盘级加密的优点是以下哪个?

A.   它提供了高性能。

B.   它可以轻松部署。

C.   这是高度灵活的。

D.   它可以保护软件和物理威胁。

34: 对于一个名为ABC的文件,以下哪个Hadoop命令用于为所有者设置所有权限,为组设置读取权限,并为系统中其他用户设置权限吗?

A.   Hadoop FS -Chmod ABC 310

B.   Hadoop FS -Chmod 740 ABC

C.   hadoop fs〜chmod 420 ABC

D.   Hadoop FS -Chmod ABC 〜860

35: HDFS授权不允许以下哪个许可级别?

A.   读

B.   写

C.   执行

D.   允许所有三个许可级别

36: Hive不支持以下哪项联接操作?

A.   左半结合

B.   内部联接

C.   theta加入

D.   模糊加入

37: 以下哪个命令用于创建Kerberos身份验证中使用的keytab文件?

A.   Kinit

B.   克里斯特

C.   ktutil

D.   mradmin

E.   DFSADMIN

38: 以下哪项是纱线的高级服务器端配置属性,用于允许时间表存储中存在的老化数据删除?

A.   Yarn.Timeline-Service.ttl-Enable

B.   Yarn.Timeline-Service.Nabled

C.   Yarn.Timeline-Service.Generic-Application-history.enabled

D.   YARN.Timeline-Service.Recovery.Anabled

39: 为了执行自定义的用户构建的JAR文件,使用JAR命令。以下哪个是此命令的正确语法?

A.   Yarn Node -jar [Main Class Name]< jar文件路径

B.   纱jar< jar文件路径> [主要班级名称] [参数…]

C.   纱线应用程序-Jar [Main Class Name]< JAR文件路径> [参数…]

D.   纱线登录JAR< JAR文件路径> [主要班级名称] [参数…]

40: 以下哪个纱线命令用于覆盖默认配置目录$ {hadoop_prefix}/conf?

A.   -Config confdir

B.   -Config。 YARNCONFIGURATION

C.   守护程序 - getlevel

D.   DaemonLog Confdir

41: 以下哪个HIVEQL命令用于打印Hive或用户覆盖的配置变量列表?

A.   放

B.   设置-v

C.   DFS

D.   重置

42: 以下HiveQL命令的正确函数是哪个给定选项?! <命令>

A.   它用于从Hive Shell执行DFS命令。

B.   它用于在CLI内部执行外壳命令。

C.   它用于从蜂巢外壳执行外壳命令。

D.   它用于在CLI内部执行DFS命令。

43: hadoop的功能是以下哪个?

A.   只有i)和iii)

B.   只有i)和ii)

C.   只有i),ii)和iv)

D.   所有i),ii),iii)和iv)

44: 纱线资源管理器的以下哪个配置属性用于指定主机:端口供客户提交作业?

A.   Yarn.ResourceManager.ha.RM-IDS

B.   Yarn.ResourceManager.Address.RM-ID

C.   Yarn.ResourceManager.HostName.RM-ID

D.   Yarn.ResourceManager.Scheduler.Address.RM-ID

45: 以下哪个HDFS命令用于设置文件或目录的扩展属性名称和值?

A.   setgid

B.   setfile

C.   setfattr

D.   setquota

E.   setConf

46: 以下哪个猪命令/用于对数据进行采样并应用查询?

A.   描述

B.   阐明

C.   解释

D.   A和B

47: 以下哪项是用于在Hadoop auth中创建文档的文档Maven配置文件的正确语法?

A.   $ MVN软件包 - PDOC

B.   $ MVN PDOC

C.   $ curl - mvn pdocs

D.   $ curl - mvn pdocs-包装

48: 如果在Hadoop中获得了服务级授权,则使用以下哪些属性来确定用于授予DataNodes权限的ACE,以通信和访问Namenode?

A.   security.client.datanode.protocol.acl

B.   security.namenode.protocol.acl

C.   security.client.protocol.acl

D.   security.datanode.protocol.acl

49: 纱线体系结构的以下安全配置属性的默认值是多少?

A.   1天

B.   3天

C.   5天

D.   7天

50: 在Hadoop中配置HTTP身份验证时,将以下哪项设置为“ hadoop.http.filter.initializers”属性的值?

A.   org.apache.hadoop.security.authenticationInitializer类名称

B.   org.apache.hadoop.security.shellbasedunixgroupsmapping类名称

C.   org.apache.hadoop.security.ldapgroupsmapping类

D.   org.apache.hadoop.security.ssl类名称

51: 以下哪个HDFS Shell命令用于为特定文件或目录设置组?

A.   chow

B.   chmod

C.   chgrp

D.   Setowner

52: HDFS的OEV命令所需的命令行参数是以下哪个?

A.   -i, - inputfile arg

B.   -o, - 输出文件arg

C.   -p, - 处理器ARG

D.   -f,-fix-txids

53: 以下哪项是Hadoop目录服务,该服务存储与群集存储中存在的文件相关的元数据?

A.   MapReduce

B.   datanode

C.   Quorumpeermain

D.   Namenode

54: InputFormat类未执行以下哪项功能?

A.   它将输入数据拆分为逻辑块,并将这些拆分中的每一个分配给地图任务。

B.   它实例化可以在每个Inputsplit类中使用的RecordReader对象。

C.   它向地图任务提供了数据的记录视图,并从输入派术类中读取。

D.   它将记录作为键值对,将记录作为键值对。

55: 以下哪个命令用于将排除的文件分配给所有名称?

A.   [hdfs] $ $ $ hadoop_prefix/sbin/distribute-exclude.sh&lt; rexclude_file&gt;

B.   $ [hadoop hdfs] sbin/distribute-exclude.sh&lt; dubl_file&gt;

C.   $ [DFSADMIN,HDFS] $ HADOOP_PREFIX/sbin/&lt; dubl_file&gt;/distribute-exclude.sh

D.   [dfsadmin] $ $ $ hadoop_prefix/ sbin/&lt; dublude_file&gt;/ distribute-exclude.sh

A.   -u和-v

B.   -b和-c

C.   -c和-u

D.   -u和-c

57: hadoop.http.authentication.token.vality属性在通过HTTP接口进行身份验证时使用的默认值是多少?

A.   72,000秒

B.   18,000秒

C.   64,000秒

D.   36,000秒

58: 如果多Quearery执行,以下哪个返回代码表示执行的可检索错误?

A.   0

B.   1

C.   2

D.   00

59: 以下哪个hadoop命令用于将源路径复制到stdout?

A.   统计

B.   复印物

C.   CP

D.   猫

60: 以下哪个Hadoop DFSadmin命令会生成数据台列表?

A.   bin/hdfs dfsadmin -r

B.   bin/hdfs dfsadmin -report

C.   bin/hdfs dfsadmin -retport dataNodes

D.   bin/hdfs dfsadmin -r datanodes

61: 以下哪个不是NodeManager REST API的应用程序(应用程序)对象的属性?

A.   容器

B.   容器

C.   状态

D.   用户

E.   应用程序

62: 以下哪项是纱线ResourceManager REST API中使用的clustermetrics对象的“ TotalMB”元素的正确数据类型?

A.   int

B.   细绳

C.   长的

D.   bigint

63: RecordReader类使用以下哪个对象来读取输入程序类别的数据?

A.   fsdatainputstream

B.   Linereader

C.   文件系统

D.   RecordReader

64: 以下哪个操作员用于解开嵌套的单元和袋子?

A.   阐明

B.   扁平

C.   cogroup

D.   叉

65: Hadoop框架由________算法组成,以解决大规模问题。

A.   MAPSYSTEM

B.   MapReduce

C.   MAPCLUSTER

D.   MAPCOMPONEN

66: 分区者控制哪些数据的分区?

A.   最终键

B.   最终值

C.   中间钥匙

D.   中间值

67: 使用哪些关键字在Hive中实现SQL窗口功能?

A.   联盟不同,等级

B.   结束,排名

C.   结束,除了

D.   联盟不同,等级

68: 与其添加次要类型以减少工作,而是执行哪种优化的最佳实践?

A.   在地图作业中添加分区的混音。

B.   为减少工作添加分区的散落。

C.   将减少的工作分解为多个链接的工作。

D.   将减少工作分解为多个锁定的地图工作。

A.   加密的HTTP

B.   未签名的HTTP

C.   压缩HTTP

D.   签名的http

70: MapReduce作业可以用哪种语言写?

A.   Java或Python

B.   仅SQL

C.   SQL或Java

D.   Python或SQL

71: 要执行中间输出的本地聚合,MapReduce用户可以选择指定哪个对象?

A.   减速器

B.   组合者

C.   映射器

D.   柜台

72: 要验证工作状态,请在___中查找值___。

A.   成功; Syslog

B.   成功; stdout

C.   完毕; Syslog

D.   完毕; Stdout

73: 哪一行代码在MapReduce 2.0中实现了还原方法?

A.   public void降低(文本键,迭代值,上下文上下文){…}

B.   公共静态void降低(文本键,intwritable []值,上下文上下文){…}

C.   公共静态void降低(文本键,迭代值,上下文上下文){…}

D.   public void降低(文本键,intwritable []值,上下文上下文){…}

74: 要获取地图作业任务中映射的输入记录的总数,您应该查看哪个计数器的值?

A.   FileInputFormatCounter

B.   FileSystemCounter

C.   求职

D.   TaskCounter(不确定)

75: Hadoop Core支持哪些帽子功能?

A.   a,p

B.   C,a

C.   c,p

D.   C,A,P

76: 还原器的主要阶段是什么?

A.   结合,映射和减少

B.   洗牌,排序和减少

C.   减少,排序和组合

D.   地图,排序和组合

77: 要设置Hadoop Workflow,通过在磁盘和内存中处理任务的作业之间的数据同步,请使用___服务,即___。

A.   Oozie;开源

B.   Oozie;商业软件

C.   Zookeeper;商业软件

D.   Zookeeper;开源

78: 对于高可用性,请使用多个类型的节点?

A.   数据

B.   姓名

C.   记忆

D.   工人

79: Datanode支持哪种类型的驱动器?

A.   支持热插拔

B.   冷交换

C.   温暖交换

D.   不可交易

80: 哪种方法用于实现Spark作业?

A.   在所有工人的磁盘上

B.   在主节点的磁盘上

C.   记忆主节点

D.   为了纪念所有工人

81: 在MapReduce作业中,Map()函数在哪里运行?

A.   在集群的还原节点上

B.   在集群的数据节点上(不确定)

C.   在集群的主节点上

D.   在集群的每个节点上

82: 为了在映射过程中引用查找的主文件,应使用哪种类型的缓存?

A.   分布式缓存

B.   本地缓存

C.   分区缓存

D.   群集缓存

83: Skip Bad Records提供了一个选项,在处理哪种类型的数据时可以跳过某些不良输入记录?

A.   缓存输入

B.   还原输入

C.   中间值

D.   地图输入

84: 哪个命令从MySQL数据库导入数据?

A.   Spark Import-Connect JDBC:mysql://mysql.example.com/spark-spark-username spark -warehouse-dir user/hue/hue/oozie/decloyments/spark

B.   sqoop导入-Connect JDBC:mysql://mysql.example.com/sqoop-sqoop-username sqoop -warehouse-dir user/hue/hue/oozie/exporations/sqoop

C.   sqoop导入-connect jdbc:mysql://mysql.example.com/sqoop-sqoop - username sqoop -password sqoop -password sqoop -warehouse-dir user/hue/hue/oozie/exployments/sqoop

D.   Spark Import-Connect JDBC:mysql://mysql.example.com/spark-sername spark -password spark -password spark -warehouse-dir user/hue/ozie/oozie/decloverments/deployments/spark

85: 呈现还原输出的形式是什么?

A.   压缩(不确定)

B.   分类

C.   没有排序

D.   加密

86: 应该使用哪个库来测试MAPREDUCE代码?

A.   朱尼特

B.   Xunit

C.   mrunit

D.   Hadoopunit

87: 如果您启动了Namenode,那么您必须成为哪种用户?

A.   Hadoop用户

B.   超级用户

C.   节点用户

D.   管理用户

88: 状态_在MapReduce工作中的JVM之间

A.   可以配置为共享

B.   部分共享

C.   共享

D.   未共享(https://www.lynda.com/hadoop-tutorials/understanding-java-virtual-machines-jvms/191942/369545-4.html)

89: 要创建MapReduce作业,应该先编码什么?

A.   静态工作()方法

B.   工作类和实例(不确定)

C.   Job()方法

D.   静态工作班

90: 要将Hadoop连接到AWS S3,您应该使用哪个客户?

A.   S3A

B.   S3n

C.   S3

D.   EMR S3

91: HBASE可以使用哪种类型的模式执行?

A.   架构写作

B.   没有模式

C.   外部模式

D.   读取的模式

92: HDFS文件是什么类型?

A.   读写

B.   只读

C.   只写

D.   仅附加

93: 分布式高速缓存文件路径可以源自哪个位置?

A.   HDFS或顶部

B.   http

C.   HDFS或HTTP

D.   HDFS

94: 您应该使用哪个库执行ETL型MapReduce作业?

A.   蜂巢

B.   猪

C.   黑斑羚

D.   Mahout

95: 还原器的输出是什么?

A.   关系表

B.   输入文件的更新

C.   一个组合列表

D.   一组<键,值>对

96: 当在公共云上实施时,Hadoop Processing交互了什么?

A.   对象存储中的文件

B.   图数据库中的图形数据

C.   托管RDBMS系统中的关系数据

D.   NOSQL数据库中的JSON数据

97: 在Hadoop系统中,使用哪种管理模式进行维护?

A.   数据模式

B.   安全模式

C.   单用户模式

D.   伪分布模式

98: 记录作者以哪种格式编写输出文件?

A.   <钥匙,值>对

B.   钥匙

C.   值

D.   <value,key>对

99: 映射器映射输入键/值对是什么?

A.   值的平均键

B.   值的键

C.   一组中间密钥/值对

D.   一组最终键/值对

100: 哪个蜂巢查询返回前1,000个值?

A.   选择…值= 1000

B.   选择…限制1000

C.   选择顶级1000…

D.   选择最大1000…