中文数据仓库问题

中文数据仓库问题

通过回答 100 多个数据仓库 MC 问题来测试您对数据仓库主题的理解。
向下滚动开始!

1: 以下哪个实现多维OLAP?

A.   Oracle Essbase

B.   IBM TM1

C.   微软SSA

D.   上述所有的

2: 关于数据擦洗的以下哪项是正确的?

A.   它与数据验证相同

B.   数据的协调不能被视为数据擦洗

C.   它涉及数据清洁

D.   数据的标准化不能被视为数据擦洗

3: 操作数据库(OLTP)基于以下哪个?

A.   雪花图架

B.   实体关系模型

C.   星模架

D.   事实星座模式

4: “切片”操作处理?

A.   选择数据立方体的任何一个维度的单元格

B.   合并除一个维度以外的所有细胞

C.   沿一个维度合并细胞

D.   选择数据立方体的一个维度以外的所有维度。

5: 以下哪项不是数据仓库的好处?

A.   维护数据历史记录

B.   提高数据质量

C.   将来自多个来源的数据整理到多个数据库中

D.   集成来自多个源系统的数据

6: 在基于MOLAP的数据仓库的数据的ETL阶段,清洁在哪里进行?

A.   ODS

B.   洁净室桌

C.   登台区

D.   没有明显的清洁阶段,在MDX查询期间清洗数据

7: 有关专门的SQL服务器,以下哪项是正确的?

A.   它使用两个级别的数据存储表示来处理密集和稀疏的数据集

B.   它为SQL查询提供高级查询语言和查询处理支持。

C.   它促进了SQL的OLTP操作

D.   它使用基于数组的多维存储引擎

8: 数据仓库是作为单独的数据存储库构建的,与企业的操作数据不同,因为?

A.   有必要使操作数据免于任何仓库操作

B.   它包含从多个来源得出的数据

C.   数据仓库无力允许其中损坏的数据

D.   数据仓库包含汇总数据,而操作数据库包含交易数据

9: OLAP骰子操作的一个例子是什么?

A.   指定特定年份和地区

B.   将年度和地区随机化

C.   指定特定年份

D.   将年份随机化

10: 什么桌子位于星形模式的中心?

A.   事实表

B.   核心表

C.   元数据表

D.   尺寸表

11: 关于Rolap的哪个是正确的?

A.   可以处理大量数据

B.   性能可能很慢

C.   所有给定选项都是有效的

D.   可以利用关系数据库固有的功能

12: 以下哪项对数据仓库的时变特征有效?

A.   所有给定选项都是有效的

B.   数据仓库包含通常从操作数据库加载的数据

C.   数据仓库的时间范围比操作系统的时间长大。

D.   数据仓库同时保持历史和(几乎)当前数据

13: 以下哪项是关于molap的?

A.   MOLAP立方用于快速数据检索

B.   Molap Cutes非常适合切片和切割操作

C.   数据存储在多维立方体中。

D.   所有给定选项都是有效的

14: 关于数据挖掘的以下哪项是正确的?

A.   它允许用户从许多不同的维度或角度分析数据

B.   所有给定选项都是有效的

C.   这是从不同角度分析数据并将其汇总到有用信息中的过程

D.   这是在各个领域之间找到相关或模式的过程

15: 以下哪个系统已优化用于多维分析?

A.   SQL

B.   etl

C.   olap

D.   OLTP

16: 以下哪项是有效的逻辑提取方法?

A.   增量提取

B.   全面提取和增量提取

C.   完全提取

D.   在线提取

17: 关于数据仓库,以下哪项是正确的?

A.   所有给定的选项都是真实的

B.   它是专门为查询和分析的交易数据的副本

C.   它旨在促进报告和分析

D.   这是一个非易失性的时间变化存储库

18: 关于雪花模式的以下哪项是正确的?

A.   它由集中事实表代表

B.   它是多维数据库中表的逻辑布置

C.   上述所有的

D.   这是星模架的变体

19: 原始数据迁移到数据仓库的过程是什么?

A.   提取,转换,加载

B.   提取测试语言

C.   导出,发射,负载

D.   导出,翻译,加载

20: 数据仓库(OLAP)基于以下哪项?

A.   星模架

B.   雪花图架

C.   事实星座模式

D.   所有给定的选项都是有效的

21: 以下哪个使用数据立方的想法来表示数据的维度?

A.   OLTP

B.   关系型数据库

C.   ODS

D.   OLAP或多维数据库

22: 哪个系统适合实时录制客户交易?

A.   星模架

B.   OLTP

C.   OLAP

D.   雪花图架

23: 何时在ETL期间使用木匠转换是否合适?

A.   当两个源具有多个匹配列时

B.   当两个来源具有外交关系的初选时

C.   上述所有的

D.   当两个来源是异质的

24: 什么是谷物"事实表?

A.   可能定义事实的最原子级别

B.   事实得出的原始数据

C.   可以将添加剂量度组合的方向

D.   事实与维度的比率

25: 以下哪项操作从较不详细的数据到高度详细的数据导航?

A.   钻探

B.   滚下来

C.   卷起

D.   钻

26: 哪些MDX操作返回一组或多种组合的所有可能组合?

A.   Crossjoin

B.   Allmembers

C.   树叶

D.   清楚的

27: 哪种语言适合查询非关系OLAP数据库?

A.   Fortran

B.   MDX

C.   SQL

D.   SPSS

28: 修改OLAP立方体以仅一年的时间查看信息就是哪个操作的示例?

A.   骰子

B.   加入

C.   枢

D.   切片

29: 以下哪项是非构度措施的示例?

A.   交易量

B.   毛利润

C.   费用

D.   默认的概率

30: 以下哪一项是正确的'枢轴'手术?

A.   它旋转数据轴以提供数据的替代介绍

B.   两个连续的切片操作在两个不同的维度上

C.   它也称为旋转

D.   所有给定选项都是有效的

31: 在ETL过程中,以下哪项是Delta检测的方法?

A.   CRC

B.   (这两个选择)

C.   (这些选择都没有)

D.   审核列

32: 哪一行不是有效的MDX评论?

A.   / *这条线 */

B.   //这线

C.   ##这线

D.   - 这线

33: 什么是数据集市?

A.   一个包括数据仓库子集的访问层

B.   在线开放交流,组织可以在其中交易业务信息

C.   将数据组织成事实和维度的模式

D.   单独组织可以安全备份数据的中央存储库

34: 选择最正确的语句:

A.   星和雪花架构包含两个事实表

B.   雪花模式包含两个事实表

C.   事实星座模式包含两个事实表

D.   Star模式包含两个事实表

35: 以下哪项不是代表销售数据的Star模式的事实表的一部分?

A.   产品尺寸表存在时的产品名称

B.   存储UID时,商店维度表存在

C.   卖出的单位

D.   以上都不是

36: 以下哪项不是数据仓库的有效特征?

A.   面向主题

B.   易挥发的

C.   非易失性

D.   融合的

37: 以下哪些环境具有更高数量的连接

A.   数据库

B.   OLAP

C.   OLTP

D.   数据仓库环境

38: 通过引入新维度执行以下哪个操作?

A.   卷起

B.   滚下来

C.   钻

D.   钻探

39: 以下哪个包含历史数据?

A.   olap

B.   OLTP

C.   OLAP和OLTP

D.   olap也不是OLTP

40: 什么是Olap Cube?

A.   数据存储和以多个维度为特征的数组

B.   以上都不是

C.   用于在线分析处理的三维阵列

D.   总结数据的尺寸还原操作

41: 以下哪项可以显示OLAP服务器的摘要数据?

A.   正常化

B.   上述所有的

C.   枢轴表

D.   主键

42: 以下哪些环境以第三态形式为3NF?

A.   所有选项都是正确的

B.   OLAP

C.   数据仓库环境

D.   OLTP

43: 关于多维模型,以下哪项是正确的?

A.   它仅使用一个级别的数据存储表示来处理稀疏数据集

B.   它仅使用一个级别的数据存储表示来处理密集的数据集

C.   它使用一个级别的数据存储表示来处理密集和稀疏数据集

D.   它使用两个级别的数据存储表示来处理密集和稀疏的数据集

44: 以下哪一项是正确的'骰子'手术?

A.   骰子操作在给定的立方体上进行了两个或多个维度的选择

B.   它通过选择一个或多个维度来形成一个新的子立方体

C.   骰子操作在给定立方体上选择一个维度

D.   它将数据从不太详细的数据导航到高度详细的数据

45: 多维数据库上的哪个操作最等同于关系联接?

A.   骰子

B.   片

C.   旋转

D.   钻孔

46: 在哪种数据存储方法中,交易数据可以将事实划分为事实?

A.   归一化方法

B.   既不是尺寸也不归一化方法

C.   尺寸和归一化方法

D.   维度方法

47: 亚马逊重新升级压缩编码分别最适合列(日期,城市,描述)?

A.   三角洲,字节 - 词典,lzo

B.   主要是8,runlength,raw

C.   BYTE-DICTICARY,LZO,DELTA

D.   Lzo,Delta,RAW

48: 以下哪项是数据仓库数据的属性?

A.   读和写

B.   只读

C.   只写

D.   写下典型

49: 以下哪个阶段涉及在源数据上执行的每项交易中仓库中的数据更新?

A.   集成数据仓库

B.   按时数据仓库

C.   离线操作数据仓库

D.   离线数据仓库

50: 以下哪种不是OLAP?

A.   关系

B.   多维

C.   杂交种

D.   分析

51: 在以下哪些情况下,“ rolap”优于“ molap”?

A.   数据仓库和关系数据库可分开

B.   当需要进行复杂的计算时

C.   当需要快速数据检索时

D.   当需要切片和切碎时

52: 在数据仓库的3层架构中,OLAP引擎与:

A.   体系结构的第一层

B.   体系结构的第二层

C.   体系结构的第三层

D.   体系结构的第四层

53: 以下哪项操作通过降低对数据立方体进行聚合?

A.   卷起

B.   滚下来

C.   钻

D.   钻探

54: 为了填充数据仓库,以下哪一组操作合适?

A.   查询和更新

B.   插入并删除

C.   刷新和负载

D.   创建和编辑

55: 在以下内容中,这不是聚类的目的?

A.   覆盖自然组

B.   它促进了OLAP操作

C.   找到一致且有效的数据组织

D.   启动有关数据的假设

56: 以下哪项是索引摩洛普立方体的最合适的数据结构?

A.   索引表

B.   b-tree

C.   位图索引

D.   霍夫曼编码

57: 以下哪项适用于事实表?

A.   部分成分

B.   完全归一化

C.   完全不合同

D.   部分标准化

58: 何时基于列的引擎比基于行的引擎更合适的数据仓库架构?

A.   查询需要的大多数列都需要

B.   动态,不可预测的查询模式

C.   要创建的少量已知索引,静态查询模式

D.   基于列的发动机仅适用于OLTP应用

59: 以下哪项不是观点的属性?

A.   可以提供立方体特定于业务的观点

B.   可以安全地限制对立方体中对象的访问

C.   可以从立方体隐藏任何数量的尺寸

D.   可以从立方体显示层次结构

60: 3型慢慢地改变数据管理的主要缺点是什么?

A.   不跟踪历史数据

B.   仅存储有限数量的历史变化

C.   每条记录可显着增加存储要求

D.   更新具有新值的过时数据过时

61: 以下哪项是缓解与稀疏维度相关的数据库爆炸的合适方法?

A.   用填充值填充稀疏尺寸

B.   将6类更新应用于稀疏维度

C.   隔离单独立方体中的稀疏尺寸

D.   为稀疏尺寸替身创建一个复合材料

62: 关于数据仓库的主题特征,以下哪项不正确?

A.   添加后永远不会删除的数据

B.   将数据输入仓库后不应更改

C.   操纵数据以提供有关特定子JEC的信息

D.   数据仓库具有定义的范围

63: 以下哪项不是子句中MDX的有效上下文?

A.   视角(措施和维度的子集

B.   一个立方体

C.   一个子立方体(嵌套的MDX查询)

D.   以上都不是

64: ETL木匠转换在源A上进行10,000行和25,000行源B进行。哪个来源应该是主人?

A.   以上都不是

B.   源B防止行被省略

C.   来源A加快加入过程

D.   没有主尾区的区别,木匠转换均给出了两个来源的奇偶校验

65: 以下哪项不是建议在MDX中的部门实施?

A.   措施。[值A]/措施。[值B]

B.   分隔(测量。[值A]/量度。[值B],null)

C.   以上都不是

D.   iff(测量。[值a] = 0,null,测量。[值A]/量度。

66: 在关系数据库中查询标准化数据以进行业务分析的目的是什么?

A.   上述所有的

B.   汇总相关数据需要创建新的主要密钥

C.   汇总相关数据需要多个表加入

D.   必须首先通过ETL过程将数据放入数据仓库中

67: 以下哪些环境具有更多索引?

A.   数据仓库env

B.   OLTP

C.   OLAP

D.   数据库

68: 以下不是首先正常形式的要求?

A.   每组相关数据的单独表格,每行具有唯一标识符

B.   没有不依赖主键的列

C.   单个表中没有重复的列

D.   以上都不是

69: 亚马逊红移的背景下的切片是什么?

A.   分布式计算节点之间共享数据层的逻辑分区

B.   平行操作隔离红移立方体的单层

C.   允许多处理器节点的每个核心的分区来处理节点的工作负载

D.   一个面向客户端的分区,该分区隔离了组织中不同类型的用户数据仓库的不同部分

70: 没有故意的安全措施,以下哪个MDX条款容易受到注射攻击?

A.   从

B.   和

C.   上述所有的

D.   在哪里

71: OLAP页面池存储在Oracle数据库10G及以后的内存中?

A.   私人SQL区域

B.   用户全球区域

C.   计划全球区域

D.   SQL工作区

72: 路由器转换和过滤器转换有什么共同点?

A.   上述所有的

B.   不会阻止输入行

C.   单个输入组转换

D.   单输出组转换

73: 在线提取过程属于哪种类型的数据提取方法?

A.   完全提取

B.   逻辑提取

C.   物理提取

D.   增量提取

74: 以下哪项是传递给Microsoft序列聚类算法的信息的所需属性?

A.   序列信息存储为嵌套表

B.   每个维度表上具有关键序列列的归一化数据

C.   星形架模式,每个维度表上都有关键序列列

D.   序列信息存储为平桌

75: 数据仓库是“集成”数据集,因为?

A.   它包含汇总数据

B.   它是从多个来源派生的数据集合

C.   这是一个关系数据库

D.   它是不同类型的数据的集合

76: 所有其他均等,单个MDX的以下哪个元素首先评估?

A.   成员[测量]。[一个平方]作为[测量]。

B.   成员[测量]。

C.   所有元素同时评估

D.   成员[测量]。[B两次]作为[测量]。

77: OLAP的模式是以下哪种?

A.   molap

B.   molap

C.   rolap

D.   rolap

E.   kolap

F.   kolap

78: OLAP查询可以被描述为在线交易,而不是:

A.   访问少量数据

B.   分析多种类型的业务要素之间的关系,例如销售,产品,地区和渠道

C.   比较在层次期间的汇总数据,例如每月每季度,每年

D.   以不同的角度呈现数据,例如按区域销售与每个区域内的产品销售

E.   快速响应用户请求,以便用户可以在不被系统困扰的情况下进行分析思维过程

79: 归一化为:

A.   根据关系数据库的规则组织数据的过程

B.   清洁数据的过程

C.   将数据集成到旧系统中

D.   压缩数据的过程

E.   在将其引入数据仓库之前消除无效数据的过程

80: 以下哪项不会被视为影响OLAP系统设计的变量?

A.   查询需求

B.   数据来源

C.   尺寸的数量

D.   原子数据量

E.   数据波动

81: 切片是:

A.   多维阵列的子集,该数组与一个或多个尺寸的一个或多个值的单个值相对应

B.   多维阵列的子集,该阵列对应于一个或多个尺寸的多个值,而不是子集中的一个或多个值

C.   多维阵列的子集,该阵列对应于子集中一个或多个成员的单个值

D.   多维阵列的子集,该阵列与子集中一个或多个成员的多个值相对应

E.   多维阵列的子集,不对应于一个尺寸的一个成员,而不是子集中的一个值

82: 可以使用以下哪些技术来提高查询性能?

A.   否定化

B.   分区

C.   摘要

D.   否定和分区

E.   否定,分区和摘要

83: OLAP一词是由:

A.   日期

B.   codd

C.   IBM

D.   Oracle

E.   微软

84: OLAP程序使用的主要对象是:

A.   多维立方

B.   元数据

C.   RDBMS表

D.   事实表

E.   枢轴表

85: 粒度是指:

A.   存储在数据仓库中的数据的有效性

B.   数据仓库中存储的事实的细节水平

C.   数据仓库中存储的数据的及时性

D.   数据仓库中存储的数据的冗余

E.   数据仓库中存储的数据的紧凑性

86: 以下哪个查询将与数据仓库相关?

A.   该客户的经常账户余额是多少?

B.   有多少客户没有按时支付余额?

C.   中间地区的客户总数是多少?

D.   HICH产品线在中部地区销售最佳,这与人口统计数据有何关系?

E.   哪个客户最多购买?

87: 数据波动率描述:

A.   数据和数据结构随时间变化的程度

B.   数据的冗余

C.   数据量

D.   数据的紧凑性

E.   数据的有效性

88: 如果以下情况,多维数据集很少:

A.   要分析的数据的数量较少

B.   如果来自数据集的尺寸的成员可能组合(交集)的比例相对较高,则包含缺少的数据

C.   如果数据集的尺寸中成员的可能组合(相交)的比例相对较高,则包含无效的数据

D.   如果来自数据集的尺寸的成员的可能组合(相交)的比例相对较高,则包含有效的数据

E.   如果来自数据集的尺寸的成员的可能组合(相交)的比例相对较高,则包含过时的数据

89: 应用于星模架的尺寸表的归一化被称为:

A.   雪花

B.   同步

C.   切片和切割

D.   复制

E.   数据转换

90: 复制指的是:

A.   将数据从一个数据库到另一个数据库的物理复制

B.   清洁数据

C.   将来自各种来源的数据集成到数据仓库中

D.   数据分析

E.   恢复数据

91: Rolap代表:

A.   循环在线分析处理

B.   关系在线分析处理

C.   减少在线分析处理

D.   旋转的在线分析处理

E.   冗余在线分析处理

92: 在星形模式中,包含有关其中一个维度的数据的表称为A:

A.   事实表

B.   元表

C.   数据词典

D.   数据透视表

E.   尺寸表

93: 以下哪项不是银行领域中数据挖掘的应用?

A.   检测欺诈性信用卡的模式使用

B.   确定一天内进行的交易数量

C.   确定客户群体的信用卡支出

D.   在不同的财务指标之间找到隐藏的相关性

E.   预测可能更改信用卡隶属关系的客户

94: Holap代表:

A.   分层在线分析处理

B.   混合在线分析处理

C.   水平在线分析处理

D.   超级在线分析处理

E.   超立方体在线分析处理

95: 一个存储多维信息的结构,每个可能的尺寸组合都具有一个单元格,称为:

A.   桌子

B.   部分

C.   分割

D.   立方体

E.   存储库

96: 哪些数据挖掘功能/技术用于分析一段时间内的记录集合?

A.   分类

B.   协会

C.   顺序/时间模式

D.   聚类

E.   分割

97: 哪种数据挖掘技术涉及开发具有学习能力的数学结构?

A.   聚类和细分

B.   神经网络

C.   模糊逻辑

D.   线性回归分析

E.   基于规则的分析

98: DataWarehouse应该能够实现高级查询功能。这意味着 :

A.   RDBMS必须提供一组完整的分析操作,包括核心顺序和统计操作

B.   RDBM不得具有任何建筑限制

C.   RDBMS服务器必须支持数百甚至数千个并发用户,同时保持可接受的查询性能

D.   查询性能不得取决于数据库的大小,而是取决于查询的复杂性

E.   仓库必须确保本地一致性,全球一致性和参考完整性

99: 将数据移入数据仓库时的修改是:

A.   数据转换

B.   复制

C.   同步

D.   数据迁移

E.   正常化

100: 关于数据挖掘的以下哪个陈述不正确?

A.   这是将数据变成信息的过程

B.   这是许多技术的集合

C.   这是olap的替代品

D.   它基于机器生成的假设

E.   它用于决策支持,预测,预测和估计