データ分析の MCQ (無料の多肢選択問題)

1: 次のタイプの時系列分析のうち、時系列で周期的または循環成分を分離することを目的としたのはどれですか？

A. 説明分析

B. スペクトル分析

C. 予測

D. 記述分析

2: 次のオプションのうち、Associationルールマイニングの正しいアプリケーションを表しているものはどれですか？

A. カタログデザイン

B. バスケットデータ分析

C. クロスマーケティング

D. 損失リーダー分析

E. 上記のすべて

F. 上記のどれでもない

3: 次のオプションのうち、テキストマイニングの正しいアプリケーションはどれですか？

A. メッセージや電子メールを自動的に処理できます。

B. Webサイトをrawって競合他社を調査できます。

C. 自由回答形式の調査回答を分析できます。

D. 保証または保険の請求を分析できます。

E. 上記のすべて。

4: Microsoft Neural Network Algorithmに関して。次のオプションのうち、データマイニングモデルの予測可能な属性値を表すニューロンタイプはどれですか？

A. 入力ニューロン

B. 隠されたニューロン

C. 出力ニューロン

D. 上記のどれでもない

5: Microsoft Naive Bayesアルゴリズムについては、次のオプションのどれが正しいですか？

A. 入力列と予測可能な列の間の条件付き確率を計算するために使用され、列が独立していると仮定します。

B. モデルの構築時に考慮される値の数を制限するために、自動機能選択を実行するために使用されます。

C. 予測モデリングで使用するために、Microsoft SQL Server Analysis Servicesによって提供されます。

D. 入力属性値の各ペアと出力属性値を検討するために使用されます。

E. 上記のすべて。

6: ロジスティック回帰手法については、次のオプションのうち正しいものはどれですか？

A. これは、高度に相関した変数の場合にグループ効果を促進するために使用されます。

B. イベント=成功とイベント=故障の確率を見つけるために使用されます。

C. 各ステップに必要に応じて、予測子を追加および削除するために使用されます。

D. 回帰係数の絶対サイズをペナルティするために使用されます。

7: データマイニングでは、回帰アルゴリズムについて次のオプションのうち正しいものはどれですか？

A. 1つ以上の連続数値変数を予測するために使用されます。例えば。データセット内の他の属性に基づく利益または損失。

B. データセット内の異なる属性間の相関を見つけるために使用されます。

C. データをグループまたは同様のプロパティを持つアイテムのクラスターに分割するために使用されます。

D. データの頻繁なシーケンスまたはエピソードを要約するために使用されます。例えば。機械のメンテナンスに先行する一連のログイベント。

8: Microsoft Association Rulesモデルに従って。次のオプションのうち、アイテムセットとその相対値に関する情報を組み合わせた正しい視聴者タブはどれですか？

A. ltemsets

B. 依存関係ネットワーク

C. ルール

D. 上記のどれでもない

9: 時系列分析の介入分析タイプについて正しいのは、次のステートメントのうちどれですか？

A. イベントが時系列の変化につながるかどうかを制限するために使用されます。

B. グラフや他のツールを使用して、時系列の傾向またはパターンを導入するために使用されます。

C. 予算編成で広く使用されています。これは歴史的傾向に基づいています。

D. これは、2つの時系列と別の時系列との相互相関を研究するために使用されます。

10: Microsoft Association Rulesアルゴリズムで使用されるMaximing_Itemset_sizeパラメーターの正しいデフォルト値は次のうちどれですか？

A. 10

B. 3

C. 1

D. 0.4

11: 高度な統計に関して、GLM（）関数の正しい構文は次のオプションのどれですか？

A. glm（formula、family = familytype（link = linkfunction）、data =）

B. glm（formula、data =、method =、control =）

C. glm（vector、start =。end =、頻度=）

D. glm（bootobject。conf=、type =）

12: XLSXパッケージのインストールを確認し、ライブラリをRワークスペースにロードするコマンドの正しい構文は次のうちどれですか？

A. grepl.any（instaled.packages（ "xlsx"））ライブラリ（ "xlsx"）

B. any（grepl（ "xlsx”、installed.package（）））library（" xlsx "）

C. any.grepl（xlsx、instald.package50）| ibrary（xlsx）

D. grepl（any（instrued.packages（xlsx）））| ibrary（xlsx）

13: 次のテキストマイニング技術のうち、同様のコンテンツを持つドキュメントのグループに使用できるのはどれですか？

A. クラスタリング

B. 分類

C. 視覚化

D. 情報抽出

14: Sol Server Data Miningでは、次のアルゴリズムタイプのうち、データセット内の他の属性に基づいた1つ以上の個別の変数を予測するものはどれですか？

A. セグメンテーションアルゴリズム

B. 分類アルゴリズム

C. シーケンス分析アルゴリズム

D. 協会アルゴリズム

15: データマイニングでは、次のオプションのうち、関連性の正しい構文はどれですか？

A. マッチアソシエーション[as pattern_name]分析{測定（s）}

B. 鉱山協会[as pattern_name] classifying_attribute_or_dimensionを分析します

C. 鉱山協会[as [pattern_name]] {matching {metapattern}}

D. 鉱山協会[as pattern_name] prestiction_attribute_or_dimensionを分析{set [abtitiont_or_dimension_i = value_i}]

16: 次の回帰手法のうち、予測変数の最小数で予測力を最大化する試みを試みるものはどれですか？

A. 段階的回帰

B. 多項式回帰

C. 線形回帰

D. ロジスティック回帰

17: Microsoft線形回帰アルゴリズムによってサポートされている予測可能な列について、次のステートメントのうち正しいものはどれですか？

A. 周期的、キー、テーブルのコンテンツタイプをサポートします。

B. キー、テーブル、および注文されたコンテンツタイプをサポートします。

C. 連続、キー、テーブルのコンテンツタイプをサポートします。

D. 連続的、周期的、順序付けられたコンテンツタイプをサポートします。

18: Microsoft時系列アルゴリズムで使用されているPrediction_smoothingパラメーターについて、次のステートメントのうち正しいものはどれですか？

A. 予測を最適化するためにモデルを混合する方法を指定します。

B. 分析と予測に使用するアルゴリズムを指定します。

C. 周期性を検出する0〜1の間の数値を指定します。

D. 各時系列ツリーでスプリットを生成するために必要な時間スライスの最小スライス数を指定します。

19: Microsoft時系列アルゴリズムで使用されるInstability_Sensitivityパラメーターの正しいデフォルト値は次のうちどれですか？

A. 0.6

B. 0.1

C. 10

D. 1

20: 高度な統計に関しては、アリマオ関数について正しいものは次のうちどれですか？

A. それを使用して、無関心な主成分分析を作成できます。

B. 最尤因子分析を生成するために使用できます。

C. 構造方程式モデルをブートストラップするために使用できます。

D. これは、自己回帰統合移動平均モデルを使用するために使用できます。

21: データマイニングでは、テキスト取得のFスコア測定について正しいものは次のうちどれですか？

A. f -score = recall -precision +（recall x precision） / 9

B. f -score = recall + precision-（recall x precision）i 7

C. f-score = recall x precision /（recall + precision） / 2

D. f -score = recall i precision x（recall -precision） / 5

22: Microsoft時系列アルゴリズムで使用されているパラメーターhisthoral_model_gapのデフォルト値は次のうちどれですか？

A. 10

B. 1

C. 0

D. 5

23: 次の高度な統計技術のうち、グループを形成する潜在変数を識別するために使用されるのはどれですか？

A. 回帰分析

B. ANOVA

C. 因子分析

D. ロジスティック回帰

24: データマイニングでは、次のオプションのどれが正確に精度を定義します。これは、テキスト検索の品質を評価するために使用されますか？

A. 精度：l [関連する] n [検索] l / l [取得] l

B. 精密= l [取得} u [f-score] l + l [f-score} l

C. 精度= l [recall] / [f-scorejl x l [recali] l

D. 精密= l [f -score] x [recalljl -l [f — score）l

25: 次のテキスト検索測定のうち、クエリに関連し、実際に取得されたドキュメントの割合はどれですか？

A. 精度

B. 想起

C. Fスコア

D. 上記のどれでもない

26: 次のうち、Microsoft Logistic RegressionアルゴリズムのHoldout_Percentageパラメーターの正しいデフォルト値はどれですか。

A. 200

B. 30

C. 255

D. 100

27: 高度な統計では、次のステートメントのうち、Dirichlet回帰法について正しいものはどれですか？

A. バイナリ変数をモデル化するために使用されます。

B. 組成データをモデル化するために使用されます。

C. ランク変数をモデル化するために使用されます。

D. カウント変数をモデル化するために使用されます。

28: 次のテキストマイニング方法のうち、文とドキュメントレベルで用語が分析されますか？

A. フレーズベースの方法（PBM）

B. タームベースの方法（TBM）

C. パターン分類法（PTM）

D. コンセプトベースの方法（CBM）

29: 高度な統計で。次の回帰方法のうち、（0、1）範囲内の変数をモデル化するために使用されるものはどれですか？

A. 尾根回帰

B. ベータ回帰

C. loss回帰

D. 等張回帰

30: Microsoft Association Rules Algorithmによると、アルゴリズムがルールを生成する前にアイテムセットを含む必要がある最小ケースの数を指定しますか？

A. Minimum_support

B. Minimut_Probability

C. minimon_itemset_size

D. minimon_itemset_count

31: 高度な統計によると、一般化された線形モデル、ガウス家のデフォルトリンク関数は次のうちどれですか？

A. （link = '’ ID "）

B. （link = '' yogit "）

C. （link = ’' iog "）

D. （link =” inverse "）

32: Microsoft Association Rulesのアルゴリズムによると、次のオプションのうち、スカラー値が戻り型としての予測関数はどれですか？

A. lsinnode（dmx）

B. PredictAssociation（DMX）

C. PredictAdjustedProbability（dmx）

D. プレディトグラム（DMX）

33: Microsoft Clusteringアルゴリズムで使用されているデフォルトのClustering_Methodは、次のオプションのどれですか？

A. 非スケーラブルなem

B. スケーラブルなem

C. スケーラブルなk-means

D. 非スケーラブルk—数字

34: 次のオプションのうち、Microsoft Logistic Regressionアルゴリズムで使用されているPREDISTHISTOGRAM（DMX）予測関数の正しいリターンタイプはどれですか？

A. ブールタイプ

B. クラスター値

C. テーブル

D. スカラー値

35: 決定ツリーの成長を制御するために使用されるMicrosoft時系列アルゴリズムのパラメーターは、次のオプションのどれですか？

A. Prediction_smoothing

B. Forecast_method

C. Instability_Sensitivity

D. complexity_penalty

36: Microsoft時系列アルゴリズムで使用されているNot Nullモデリングフラグについて正しいのは、次のステートメントのうちどれですか？

A. マイニングモデルの列に適用されます。

B. マイニング構造列に適用されます。

C. マイニングモデルカラムとマイニング構造列の両方に適用されます。

D. マイニングモデルの列にもマイニング構造列にも適用されません。

37: 次のサンプリング方法のうち、均一な単位ではなく宇宙の異種ユニットに使用され、その人口が既知の場合にのみ採用できるものはどれですか？

A. 単純なランダムサンプリング

B. 層別ランダムサンプリング

C. 広範なサンプリングf

D. クォータサンプリング

38: 次のステートメントのうち、サンプリング方法について誤っているものはどれですか？

A. サンプリング方法では、データをより速く収集できます。

B. サンプリング方法は、研究作業を便利に整理して実行する施設を提供します。

C. 安価です。

D. サンプリング方法を使用するためには、専門的な知識は必要ありません。

39: 次のステートメントのうち、パンダについては正しくないものはどれですか？

A. 不均一な列 - タイプの列を使用した表形式データに適しています。

B. ラベル付きデータのみをパンダデータ構造に配置できます。

C. 任意のマトリックスデータ（均一に型付けまたは不均一な）には、行と列のラベルが付いています。

D. 秩序化されていない（必ずしも固定されていない頻度ではない）時系列データも、パンダで分析できます。

40: テキストの検索の品質を評価するために使用される次の基本的な測定値のうち、クエリに関連する取得されたドキュメントの割合を表すものはどれですか？

A. 想起

B. Fスコア

C. 精度

D. AとCの両方

41: 次のデータマイニングアルゴリズムのうち、多数のトランザクションを含むデータベースに適用され、関連付けのルールも学習されますか？

A. k-means

B. C45

C. em

D. アプリオリ

42: Pylab環境で作業している間、次のオプションをインポートする必要のないものはどれですか？

A. matplotlib

B. パンダ

C. numpy

D. AとC の両方

43: 関連するルールマイニングでは、次の状況のどれでアイテムセットが閉じられていると見なされますか？

A. すべての即時スーパーセットがアイテムセットと同じサポートを持っている場合。

B. その即時サブセットのいずれも、アイテムセットと同じサポートを持っていない場合。

C. すべての即時サブセットがアイテムセットと同じサポートを持っている場合。

D. その即時のスーパーセットのいずれも、アイテムセットと同じサポートを持っていない場合。

44: AとBは、それぞれ3,114と2,1/4を持つ2つの独立した二項変数であることが与えられています。 P（A + B 21）を見つけます。

A. 1/1024

B. 1023/1024

C. 11512

D. 511/512

45: 次のテキストマイニングプロセスのどのバッグモデルが使用されますか？

A. 機能の選択

B. テキストの前処理

C. 機能生成

D. AもBも

46: 12人の学生のグループの場合、科学と数学のランクの違いの平方の合計は60として与えられます。与えられた情報に基づいて。ランク相関係数の値を見つけます。

A. 0.60

B. 0.79

C. 0.45

D. 0.82

47: 12年間の期間にわたって販売と支出の間のランク相関係数を計算します。 1年のランクの差は、7ではなく9と誤って取られ、その結果、ランク相関係数の値は0.79として計算されました。間違いが修正されている場合、ランク相関係数のおおよその正しい値はどうなりますか？

A. 0.88

B. 0.82

C. 0.95

D. 0.90

48: グリッドベースのパーティション化に使用されるクラスタリングアルゴリズムのどれはどれですか？

A. バーチ

B. k-means

C. 刺す

D. FCM

49: 相関係数が0.87になるように、xとyに15組の測定値があることが与えられています。また、標準偏差が5.60であることも与えられています。 X上のYの推定の近似標準誤差はどうなりますか？

A. 2.5

B. 2.8

C. 3.2

D. 3.4

50: サムは12ショットのうち6ショットでターゲットを打つことで人気がありますが、ジョンは14ショットのうち8ショットで同じターゲットを打つことができます。両方が試みたときにターゲットがヒットする確率はどうなりますか？

A. 11/14

B. 13/14

C. 1/14

D. 3/14

51: 以下のうち、非財産サンプリング方法はどれですか？

A. 判断サンプリング

B. 層別ランダムサンプリング

C. 集落抽出

D. 多段階のランダムサンプリング

52: ベイジアン信念ネットワークについては、次のステートメントのうち正しいものはどれですか？

A. L1信念ネットワークでは、クラス条件付き独立性を変数のサブセット間で定義できます。

B. VJジョイント条件付き確率分布は、ベイジアン信念ネットワークで指定することはできません。

C. VJ訓練されたベイジアンネットワークは分類に使用できません。

D. VJ学習を実行するためのカジュアルな関係のグラフィカルモデルは、ベイジアン信念ネットワークによって提供されます。

53: 次のステートメントのうち、判断サンプリング方法について正しいものはどれですか？

A. この方法には個人的な偏見の可能性はありません。

B. より正確で信頼性があります。

C. ほとんどの場合、ほぼ類似したユニットが存在するか、一部のユニットがサンプルから除外するには重要すぎる分野で使用されています。

D. それは、とても（値段が）高いです。

54: ベイシアンモデルでは、次のうち、（6、x）の関節密度の正しい表現はどれですか。特定の0で、観測されたデータxがPAの実現であることがわかっている場合、

A. n（xl0）p（x）

B. n（0）p（x）

C. n（0）p（xl0）

D. nl（x）p（0lx）

55:
次のコマンドのうち、Rオブジェクトが構造化されている方法を観察するために使用されるコマンドはどれですか？ MyDataは、ユーザーのデータが保存される変数であるとされています。

A. 図書館（mydata）

B. 説明（mydata）

C. str（mydata）

D. 要約（mydata）

56: 次のビッグデータテクノロジーのうち、関連するデータ管理、分析、レポートのタスクをデータが存在する場所に移動し、洞察の速度を向上させ、データの動きを削減し、より良いデータガバナンスを促進しますか？

A. Hadoopのサポート

B. LNメモリー分析

C. グリッドコンピューティング

D. ln-database処理

57: 次のコマンドのうち、IPythonインターフェイスをインラインPylabモードで開始し、Pylab環境でiPythonノートブックを開くために使用されるコマンドはどれですか？

A. iPython —Pylab = in | ine

B. iPython —Pylab = inline -notebook

C. iPython = Notebook —Pylab.in | ine

D. iPythonノートブック—Pylab = inline

58: LNデータマイニング、ベイズの定理によると、次の式のうち、事前の確率の観点から後の確率を表すものはどれですか？

A. p（x/h）= p（h/x）p（h）/p（x）

B. p（h/x）= p（x/h）p（h）/p（x）

C. p（h/x）= p（x/h）p（x）/p（h）

D. p（xih）= p（h/x）/p（h）p（x）

59: データマイニングでは、次のステートメントのうち、C45アルゴリズムについて正しくないものはどれですか？

A. 結果は1つだけです。

B. C45では、二項式の連合制限から派生した単一パスアルゴリズムが使用されています。

C. 情報ベースの基準を使用します。

60: ユーザーがトラフィックを自分のウェブサイトに送信するトップキーワードについて学びたい場合、次の取得セグメンテーションのうちどれが優先されるべきか？

A. 紹介トラフィック

B. オーガニックトラフィック

C. 直接人身人

D. ソーシャルトラフィック

61: Google Analyticsツールでは、ユーザーのWebトラフィックの起源を特定するために、次の分析のうちどれを実行する必要がありますか？

A. 買収分析

B. オーディエンス分析

C. 動作分析

D. 変換分析

62: 次のタイプの関連採掘のうち、シーケンスデータベース内のMinsupシーケンス以上のものに共通するサブシーケンスを発見するものはどれですか？

A. シーケンシャルルール

B. 一般化された協会規則

C. シーケンシャルパターンマイニング

D. 暖かい

63: 次の要因のうち、サンプリングエラーの発生の原因はどれですか？

A. 間違った統計的測定によるエラー。

B. コンピレーションのエラー。

C. 間違ったアンケートのフレーミング。

D. サンプリングユニットの誤った境界。

64: データマイニングでは、次のうち、テキストの検索の品質を評価するために使用されるリコールを定義するための正しい構文はどれですか？

A. recall = l [requant} u [retrieved] l l l [requant}！

B. recall = l [requant} u [取得] | L l {回収] l

C. recall = l [relavant} f‌l {retriveved} | / l [取得] l

D. recall = l [relative} n [取得} l / l [relevantji ]

65: 特定の論理基準に基づいて、データフレームから特定の行を選択するために使用される正しいR構文は次のうちどれですか？

A. select（dataFramEname、論理式）

B. f‌ilter（論理式、dataFramEname）

C. f‌ilter（dataFramename、論理式）

D. select（論理式、dataFramEname）

66: 生存分析では、予測変数のセットでハザード関数をモデル化するために次の方法のどれが使用されますか？

A. surv（）

B. coxph（）

C. survdiff（）

D. survfftiT（）

67: 次のうち、データマイニングに関与する説明機能はどれですか？

A. 進化分析

B. 予測

C. 外れ値分析

D. 協会の採掘

68: 次のステートメントのうち、データサイエンスについては正しくないものはどれですか？

A. データをアクションに変えるために使用されます。

B. 演ductiveと帰納的推論の間のシフトをサポートし、奨励します。

C. 成功を達成するために。組織は、最大のデータサイエンスの成熟度に達する必要があります。

D. 企業は将来パックにとどまり、競争する必要があります。

69: 次のクラスタリングアルゴリズムのうち、うるさいデータを処理できるものはどれですか？

A. 治す

B. 石

C. バーチ

D. カメレオン

70: 次のステートメントのうち、データウェアハウジングのクエリ駆動型アプローチについて正しいものはどれですか？

A. このアプローチでは、複雑な統合とフィルタリングプロセスが必要です。

B. このアプローチにより、データをコピーできます。処理。統合。注釈。事前にセマンティックデータストアで要約および再構築されました。

C. 集約を必要とするクエリにとっては非常に経済的です。

D. 頻繁なクエリの方がかなり効率的です。

71: yはポアソンバリエートであり、条件p（y = 4）= p（y = 5）を満たすことが与えられます。 Yの平均と標準偏差の値は何ですか？

A. 平均= 3および標準偏差= /5

B. 平均= 5および標準偏差= /3

C. 平均= 5および標準偏差= /’5

D. 平均= 7および標準偏差= /7

72: 次の機能のうち、加法トレンドと季節的および不規則なコンポーネントを使用して時系列を分解するために使用される機能はどれですか？

A. stl0

B. tso

C. etso

D. アリマオ

73: データマイニングでは、次のモデルのうち、カテゴリのクラスラベルを予測するために使用されるものはどれですか？

A. 分類モデル

B. 予測モデル

C. AもBも

D. AもBもありません

74: ビッグデータからビジネス価値を抽出するために使用される主要なテクノロジーのうち、データは戦略的として管理されています。ビッグデータ分析の継続的なプロセス制御を伴うコアアセット？

A. ビッグデータの情報管理

B. ビッグデータの高性能分析

C. ビッグデータの柔軟な展開オプション

75: 関連するルールマイニングでは、ルールが真であることがわかっている頻度の指標は、信頼として知られる用語で表されます。この用語はどうですか。自信。ルールのために表されます、a => b？

A. conf（a => b）= supp（a u b） / supp（a）

B. conf（a => b）= supp（b） / supp（a）

C. conf（a => b）= supp（a u b） / supp（a） 'supp（b）

D. conf（a => b）= supp（a u b） / 1 -supp（a）

76: 25項目の特定のセットでは、xとyの相関の係数は0.6です。 xとyの算術平均の値はそれぞれ14と18であり、xとyの標準偏差の値はそれぞれ4と6です。ペア（25. 18）が誤って（18、25）と誤ってとられている場合。次に、相関係数の正しい値を見つけます。

A. 0.31

B. 0.42

C. 0.51

D. 0.67

77: 母集団の下部尾試験の帰無仮説を表現する正しい方法は次のうちどれですか？ UOは真の母集団の仮説の下限であるとされています

A. 5 ll

B. P0 = L1

C. PO 2 p

78: データマイニングでは、決定ツリーの次の部分のうち、テストの結果を表すものはどれですか？

A. 内部ノード

B. リーフノード

C. ブランチ

D. 一番上のノード

79: 次のステートメントのうち、SAS差別化要因について正しいものはどれですか？

A. 剛性のあるアーキテクチャアプローチを提供します。

B. 一度に1つのモデルのみを管理および活用できます。

C. 組織がビッグデータとビッグデータ分析をビジネス価値に変えるのを支援するために、ユニークな位置にあります。

D. オプションAとCの両方が正しいです。

80: データの分類について正しいのは次のうちどれですか？

A. データを正確で凝縮した形式にします。

B. LL統計分析は、分類データを除くすべてのタイプのデータで可能です。

C. ii]さまざまな特性の比較を許可しません。

D. 不要な詳細を排除することにより、データをより簡単に理解しやすくします。

81: 判別関数分析の線形判別関数では、次の方法の機能は何ですか？

A. それはジャックマイフされた予測を生成します。

B. 二次判別関数を取得するために使用されます。

C. 中央にあるが標準化されていない変数に基づいて、判別関数を印刷します。

D. 一度に2つの変数を使用して、線形または二次分類の結果を表示できます。

82: データマイニングでは、次の分類モデルのどれがKNNアルゴリズムによって構築されていますか？

A. 決定ツリー分類モデル

B. アンサンブル分類モデル

C. ハイパープレーン分類モデル

D. knn によって分類モデルは構築されていません

83: データマイニングでは、ルールrのルール剪定に使用されるフォイル法の正しい構文であるfoil_pruneは次のうちどれですか？ PはRとNで覆われた陽性のタプルの数であると言われています。

A. foil_prune = p -n/p + n

B. foil_prune = p + n/p -n

C. foil_prune = p/n

D. foil_prune = n/p + n

84: 仮説検査で。データがカテゴリーであり、個別の非重複クラスのコレクションに属する集団を何と呼びますか？

A. モノマリアル

B. 二項

C. 三位一体

D. 多項

85: 2つの異なるグループの平均を比較するために、次のどのt検定を実行する必要がありますか？

A. 1つのサンプルt-テスト

B. ペアのサンプルT-テスト

C. 独立したサンプルt検定

D. 分散分析（ANOVA）

86: 関連するルールマイニングでは、次のステートメントのうち、2段階のアプローチの頻繁なアイテムセット生成について正しいものはどれですか？

A. 2分間のサポートの1つのアイテムセットのみを生成します

B. サポート5分のすべてのアイテムセットを生成します

C. サポート5分のすべてのアイテムセットを生成します

D. 各頻繁なアイテムセットから高い信頼ルールを生成します

87: ユーザーは、次のWeb分析目標のどれを使用して、Webサイトのページビューを取得できますか？

A. ページ/セッションの目標

B. 期間目標

C. 目的地の目標

D. イベントの目標

88: 欠損値のあるデータがあり、関数のヘルプを読む必要がある場合は、中央値をたとえば、次のうち、そうするための正しいR構文はどれですか？

A. ？中央値

B. read.median0

C. #Median

D. help.median0

89: Web分析では、次のメトリックのうち、eコマースダッシュボードで監視されているものはどれですか？

A. ブラウザによるページの読み込み時間

B. 製品による総販売

C. ブログ投稿ごとの変換

D. リアルタイムトラフィックソース

90: パラメトリック統計モデルは、（s、p）p = [p6：e e 9]を使用します。統計表記に基づいて、次のうちどれがAを表す正しい方法ですか？

A. E G R 0D

B. A = R2D

C. o c 2dr

D. e drz

91: テストの重要なレベルが5％の場合、得られたp値が0.05を超える場合、テストの結果はどうなりますか？

A. 帰無仮説を拒否します

B. 帰無仮説を拒否しない

C. 帰無仮説の受け入れまたは拒否は、p値とは無関係です。

92: マイクロソフト時系列アルゴリズムで使用されているパラメーターhlstorlcal_model_gapのデフォルト値は次のうちどれですか？

A. 10

B. 1

C. 0

D. 5

93: タスク関連データの指定に使用されるDMQL構文は次のうちどれですか？

A. データベースデータベース_NAMEを使用

B. データウェアハウスdata_warehouse_nameを使用します

C. database.usedatabase_name

D. datawarehouse.usedata_warehouse_name

94: _______冗長性を識別および排除することにより、ファイルのビット数を減らします

A. ロスレス圧縮

B. 喪失した圧縮

C. ビットマップ

D. データの視覚化

95: プログラマーによって作成されたデータ型は________として知られています。

A. 変数

B. 抽象データ型（ADT）

C. 機能

D. パラメーター

E. どれでもない

96: ディゴとおいしいのは________ツールです。

A. ソーシャルブックマーク

B. リサーチ

C. ディスカッショングループ

D. 同期通信

97: 汚れたデータは________です。

A. ウイルス感染データ

B. ワーム感染データ

C. 不正確で不完全なデータ

D. 盗まれたデータ

98: ワークシートの______は、その外観を定義しています。

A. 形状

B. フォーマット

C. 意見

D. 記録

99: ____ケースツールは、コーディングおよび実装フェーズのサポートを提供します。

A. 水平

B. フロントエンド

C. バックエンド

D. 垂直

100: ________ツールとテクニックデータを処理し、洞察と発見のために統計分析を行います。

A. エンタープライズデータガバナンス

B. 独自の情報システム

C. ビジネス・インテリジェンス

D. ビジネスプロセス

日本語でのデータ分析の質問

日本語でのデータ分析の質問

1: 次のタイプの時系列分析のうち、時系列で周期的または循環成分を分離することを目的としたのはどれですか？

2: 次のオプションのうち、Associationルールマイニングの正しいアプリケーションを表しているものはどれですか？

3: 次のオプションのうち、テキストマイニングの正しいアプリケーションはどれですか？

4: Microsoft Neural Network Algorithmに関して。次のオプションのうち、データマイニングモデルの予測可能な属性値を表すニューロンタイプはどれですか？

5: Microsoft Naive Bayesアルゴリズムについては、次のオプションのどれが正しいですか？

6: ロジスティック回帰手法については、次のオプションのうち正しいものはどれですか？

7: データマイニングでは、回帰アルゴリズムについて次のオプションのうち正しいものはどれですか？

8: Microsoft Association Rulesモデルに従って。次のオプションのうち、アイテムセットとその相対値に関する情報を組み合わせた正しい視聴者タブはどれですか？

9: 時系列分析の介入分析タイプについて正しいのは、次のステートメントのうちどれですか？

10: Microsoft Association Rulesアルゴリズムで使用されるMaximing_Itemset_sizeパラメーターの正しいデフォルト値は次のうちどれですか？

11: 高度な統計に関して、GLM（）関数の正しい構文は次のオプションのどれですか？

12: XLSXパッケージのインストールを確認し、ライブラリをRワークスペースにロードするコマンドの正しい構文は次のうちどれですか？

13: 次のテキストマイニング技術のうち、同様のコンテンツを持つドキュメントのグループに使用できるのはどれですか？

14: Sol Server Data Miningでは、次のアルゴリズムタイプのうち、データセット内の他の属性に基づいた1つ以上の個別の変数を予測するものはどれですか？

15: データマイニングでは、次のオプションのうち、関連性の正しい構文はどれですか？

16: 次の回帰手法のうち、予測変数の最小数で予測力を最大化する試みを試みるものはどれですか？

17: Microsoft線形回帰アルゴリズムによってサポートされている予測可能な列について、次のステートメントのうち正しいものはどれですか？

18: Microsoft時系列アルゴリズムで使用されているPrediction_smoothingパラメーターについて、次のステートメントのうち正しいものはどれですか？

19: Microsoft時系列アルゴリズムで使用されるInstability_Sensitivityパラメーターの正しいデフォルト値は次のうちどれですか？

20: 高度な統計に関しては、アリマオ関数について正しいものは次のうちどれですか？

21: データマイニングでは、テキスト取得のFスコア測定について正しいものは次のうちどれですか？

22: Microsoft時系列アルゴリズムで使用されているパラメーターhisthoral_model_gapのデフォルト値は次のうちどれですか？

23: 次の高度な統計技術のうち、グループを形成する潜在変数を識別するために使用されるのはどれですか？

24: データマイニングでは、次のオプションのどれが正確に精度を定義します。これは、テキスト検索の品質を評価するために使用されますか？

25: 次のテキスト検索測定のうち、クエリに関連し、実際に取得されたドキュメントの割合はどれですか？

26: 次のうち、Microsoft Logistic RegressionアルゴリズムのHoldout_Percentageパラメーターの正しいデフォルト値はどれですか。

27: 高度な統計では、次のステートメントのうち、Dirichlet回帰法について正しいものはどれですか？

28: 次のテキストマイニング方法のうち、文とドキュメントレベルで用語が分析されますか？

29: 高度な統計で。次の回帰方法のうち、（0、1）範囲内の変数をモデル化するために使用されるものはどれですか？

30: Microsoft Association Rules Algorithmによると、アルゴリズムがルールを生成する前にアイテムセットを含む必要がある最小ケースの数を指定しますか？

31: 高度な統計によると、一般化された線形モデル、ガウス家のデフォルトリンク関数は次のうちどれですか？

32: Microsoft Association Rulesのアルゴリズムによると、次のオプションのうち、スカラー値が戻り型としての予測関数はどれですか？

33: Microsoft Clusteringアルゴリズムで使用されているデフォルトのClustering_Methodは、次のオプションのどれですか？

34: 次のオプションのうち、Microsoft Logistic Regressionアルゴリズムで使用されているPREDISTHISTOGRAM（DMX）予測関数の正しいリターンタイプはどれですか？

35: 決定ツリーの成長を制御するために使用されるMicrosoft時系列アルゴリズムのパラメーターは、次のオプションのどれですか？

36: Microsoft時系列アルゴリズムで使用されているNot Nullモデリングフラグについて正しいのは、次のステートメントのうちどれですか？

37: 次のサンプリング方法のうち、均一な単位ではなく宇宙の異種ユニットに使用され、その人口が既知の場合にのみ採用できるものはどれですか？

38: 次のステートメントのうち、サンプリング方法について誤っているものはどれですか？

39: 次のステートメントのうち、パンダについては正しくないものはどれですか？

40: テキストの検索の品質を評価するために使用される次の基本的な測定値のうち、クエリに関連する取得されたドキュメントの割合を表すものはどれですか？

41: 次のデータマイニングアルゴリズムのうち、多数のトランザクションを含むデータベースに適用され、関連付けのルールも学習されますか？

42: Pylab環境で作業している間、次のオプションをインポートする必要のないものはどれですか？

43: 関連するルールマイニングでは、次の状況のどれでアイテムセットが閉じられていると見なされますか？

44: AとBは、それぞれ3,114と2,1/4を持つ2つの独立した二項変数であることが与えられています。 P（A + B 21）を見つけます。

45: 次のテキストマイニングプロセスのどのバッグモデルが使用されますか？

46: 12人の学生のグループの場合、科学と数学のランクの違いの平方の合計は60として与えられます。与えられた情報に基づいて。ランク相関係数の値を見つけます。

48: グリッドベースのパーティション化に使用されるクラスタリングアルゴリズムのどれはどれですか？

49: 相関係数が0.87になるように、xとyに15組の測定値があることが与えられています。また、標準偏差が5.60であることも与えられています。 X上のYの推定の近似標準誤差はどうなりますか？

51: 以下のうち、非財産サンプリング方法はどれですか？

52: ベイジアン信念ネットワークについては、次のステートメントのうち正しいものはどれですか？

53: 次のステートメントのうち、判断サンプリング方法について正しいものはどれですか？

54: ベイシアンモデルでは、次のうち、（6、x）の関節密度の正しい表現はどれですか。特定の0で、観測されたデータxがPAの実現であることがわかっている場合、

55: 次のコマンドのうち、Rオブジェクトが構造化されている方法を観察するために使用されるコマンドはどれですか？ MyDataは、ユーザーのデータが保存される変数であるとされています。

56: 次のビッグデータテクノロジーのうち、関連するデータ管理、分析、レポートのタスクをデータが存在する場所に移動し、洞察の速度を向上させ、データの動きを削減し、より良いデータガバナンスを促進しますか？

57: 次のコマンドのうち、IPythonインターフェイスをインラインPylabモードで開始し、Pylab環境でiPythonノートブックを開くために使用されるコマンドはどれですか？

58: LNデータマイニング、ベイズの定理によると、次の式のうち、事前の確率の観点から後の確率を表すものはどれですか？

59: データマイニングでは、次のステートメントのうち、C45アルゴリズムについて正しくないものはどれですか？

60: ユーザーがトラフィックを自分のウェブサイトに送信するトップキーワードについて学びたい場合、次の取得セグメンテーションのうちどれが優先されるべきか？

61: Google Analyticsツールでは、ユーザーのWebトラフィックの起源を特定するために、次の分析のうちどれを実行する必要がありますか？

62: 次のタイプの関連採掘のうち、シーケンスデータベース内のMinsupシーケンス以上のものに共通するサブシーケンスを発見するものはどれですか？

63: 次の要因のうち、サンプリングエラーの発生の原因はどれですか？

64: データマイニングでは、次のうち、テキストの検索の品質を評価するために使用されるリコールを定義するための正しい構文はどれですか？

65: 特定の論理基準に基づいて、データフレームから特定の行を選択するために使用される正しいR構文は次のうちどれですか？

66: 生存分析では、予測変数のセットでハザード関数をモデル化するために次の方法のどれが使用されますか？

67: 次のうち、データマイニングに関与する説明機能はどれですか？

68: 次のステートメントのうち、データサイエンスについては正しくないものはどれですか？

69: 次のクラスタリングアルゴリズムのうち、うるさいデータを処理できるものはどれですか？

70: 次のステートメントのうち、データウェアハウジングのクエリ駆動型アプローチについて正しいものはどれですか？

71: yはポアソンバリエートであり、条件p（y = 4）= p（y = 5）を満たすことが与えられます。 Yの平均と標準偏差の値は何ですか？

72: 次の機能のうち、加法トレンドと季節的および不規則なコンポーネントを使用して時系列を分解するために使用される機能はどれですか？

73: データマイニングでは、次のモデルのうち、カテゴリのクラスラベルを予測するために使用されるものはどれですか？

74: ビッグデータからビジネス価値を抽出するために使用される主要なテクノロジーのうち、データは戦略的として管理されています。ビッグデータ分析の継続的なプロセス制御を伴うコアアセット？

75: 関連するルールマイニングでは、ルールが真であることがわかっている頻度の指標は、信頼として知られる用語で表されます。この用語はどうですか。自信。ルールのために表されます、a => b？

77: 母集団の下部尾試験の帰無仮説を表現する正しい方法は次のうちどれですか？ UOは真の母集団の仮説の下限であるとされています

78: データマイニングでは、決定ツリーの次の部分のうち、テストの結果を表すものはどれですか？

79: 次のステートメントのうち、SAS差別化要因について正しいものはどれですか？

80: データの分類について正しいのは次のうちどれですか？

81: 判別関数分析の線形判別関数では、次の方法の機能は何ですか？

55:
次のコマンドのうち、Rオブジェクトが構造化されている方法を観察するために使用されるコマンドはどれですか？ MyDataは、ユーザーのデータが保存される変数であるとされています。