日本語でのデータマイニングの質問

日本語でのデータマイニングの質問

これらのデータ マイニングの複数選択の質問と回答は、データ マイニングのトピックをより深く理解するのに役立ちます。 これらの 100 以上の MCQ データ コレクションを使用して、次の試験や面接の準備をすることができます。
下にスクロールして回答を始めてください。

1: データマイニングからどの業界が恩恵を受けることができますか?

A.   これらすべて

B.   小売り

C.   製造

D.   財務/銀行

2: これらのレイヤーのどれで、ニューラルネットワークは始まりますか?

A.   出力層

B.   隠されたレイヤー

C.   透明な層

D.   入力レイヤー

3: コードの一部を変更すると、______________データの問題につながる可能性があります。

A.   一貫性のない

B.   汚れた

C.   非統合

D.   粒状

4: ニューラルネットでは、トポロジーは何を参照していますか?

A.   セット内の変数の範囲

B.   使用されるノードの数

C.   データのグラフィカルな視覚化

D.   各レイヤーのレイヤー数とノードの数

5: 次のクラスタリングアルゴリズムのうち、任意の形状のクラスターを見つけることができるものはどれですか?

A.   シングルリンク

B.   DSBSCAN

C.   これらの両方の

D.   どれでもない

6: 意思決定ツリーは、インポート変換を使用せずに欠損値を処理できます。正しいか間違っているか?

A.   間違い

B.   真実

7: a(n)_____アルゴリズムは、イベントが一緒に発生した頻度を説明するルールを作成します。

A.   シャイド

B.   人口的

C.   剪定

D.   連想

8: 次のうち、有効なXMLはどれですか?

A.   < Body Answer =" valid"> This One</body>

B.   < valid> This One</valid>

C.   < valid>"この1つ"</valid>

D.   すべてが有効です

9: 次のうち、リレーショナルデータベースではないものはどれですか?

A.   上記のすべて

B.   Apache Cassandra

C.   Google Big Table

D.   mongodb

10: データの視覚化とは何ですか?

A.   サーバーに保存されているデータの行為の技術用語

B.   データ結果の構造化および開発された予測

C.   多次元データにおける複雑な関係の視覚的解釈

11: KDDプロセスとは何ですか?

A.   差動復号化

B.   インパクトの高い次元で測定されたクヌープハードネス

C.   データベースでの知識の発見

D.   k-meanデータ発見

12: これらのどれが分析ソフトウェアのタイプではありません:

A.   すべてが有効なタイプです

B.   ニューラルネットワーク

C.   統計

D.   機械学習

13: 正しいか間違っているか?経済指標は外部データ要因です。

A.   間違い

B.   真実

14: 次の分野のうち、データマイニングの重複を重複させるものはどれですか?

A.   上記のすべて

B.   人工知能

C.   統計

D.   言語学

15: 予測モデルでは、予測される値またはクラスは次のように呼ばれます。

A.   依存

B.   これらすべて

C.   応答

D.   ターゲット変数

16: あなたは小売銀行の信用リスクマネージャーです。顧客に関するいくつかの情報は、分析に利用できます。このデータに基づいて、人が良い顧客または悪い顧客になると判断する必要があります。このビジネス上の問題に対して適切なデータマイニングタスクを選択してください。

A.   分類

B.   回帰

C.   セグメンテーション

17: 関係と好みにグループ化されたデータ項目は、次のように知られています。

A.   予測可能なセット

B.   止まる組織

C.   適合度

D.   クラスター

18: 決定木とは何ですか?

A.   資格のあるデータサイエンティストによって生成された複雑なレポート

B.   ハイパーキューブブラウザーで作成できる階層的寸法

C.   参照帳から入手可能なデータなど、組織によって収集されないデータ

D.   データセットの分類のためのルールを生成する構造

19: 人気のあるデータマイニング方法はどれですか?

A.   リレーショナル学習モデル

B.   決定ツリーとルール

C.   これらすべて

D.   確率的グラフィック依存性モデル

20: 偽りのことは?ゆるい結合データマイニングアーキテクチャは、主に、高いスケーラビリティと高性能を必要としないメモリベースのデータマイニングシステム向けです。

A.   間違い

B.   真実

21: クリスプDMとは何ですか?

A.   1980年に開発された決定ツリー'

B.   電子商取引の購入習慣を予測するための6つのフェーズ方法

C.   Microsoft'の線形回帰アルゴリズム

D.   データマイニングのための産業を超えた標準プロセス

22: ニューラルネットのノードによって使用される関数は、値の任意のドメインからの入力データを有限範囲の値の範囲に変換するために(n)として知られています。

A.   前件

B.   アクティベーション機能

C.   混乱マトリックス

D.   カイ二乗

23: 正しいか間違っているか?カートのテストは常にバイナリです。

A.   真実

B.   間違い

24: 2つのランダム変数がどれだけ変化するかの尺度は何ですか?

A.   バイナリ標準偏差

B.   共分散

C.   ポリコンバージェンス

D.   確率的慣性

25: これらのうち、シーケンシャルパターン関係の例はどれですか?

A.   ビジネスエクスペリエンスとガット本能を使用して、食料品店で新しいフロアプランを設計する

B.   パフォーマンスの分析に基づいて、バスケットボールチームのスタートラインナップを再編成する

C.   棚に2つの頻繁に購入するアイテムを隣に配置する

D.   寝袋とハイキングシューズの消費者の購入に基づいてバックパックが購入される可能性を予測する

26: 国際企業の年間収益は、広告、為替レート、インフレ率などの他の属性と相関しています。これらの価値(または来年の信頼できる推定)を持っている会社は、来年の予想収益を計算する必要があります。このビジネス上の問題に対して適切なデータマイニングタスクを選択してください。

A.   セグメンテーション

B.   分類

C.   回帰

27: データマイニングアーキテクチャのフロントエンド層は何ですか?

A.   直感的でユーザーフレンドリーなユーザーインターフェイス

B.   悪意のあるソースからデータを保護するために確立されたファイアウォール

C.   膨大な量のデータを保存するために特別に設計されたハードウェア

D.   特定の鉱業プロジェクトで利用されたソフトウェアを設計したプログラマーのチーム

28: ハイパープレーンはaです

A.   データのクラスを分離する決定境界

B.   C4.5アルゴリズムのバリアント

C.   リンクされたハイパーテキストファイルのコレクション

D.   非終了エラー条件

29: 専有データベースからのデータなど、組織によって収集されないデータは、組織自身のデータと組み合わされています。

A.   かぶせる

B.   オーバーフィッティング

C.   ノイズ

D.   適用されない日付

30: これらのうち、内部データ要因とは見なされないものはどれですか?

A.   価格

B.   経済の低迷

C.   スタッフのスキル

D.   製品の位置付け

31: どのデータマイニング手法が定義されたグループにデータのセットを整理しますか?

A.   シーケンシャルパターニング

B.   クラスタリング

C.   分類

D.   ゲーミフィケーション

32: 変数が局所的に互いに依存する(多くの場合グラフィカルに)指定するモデルのレベル。

A.   構造レベル

B.   定性レベル

C.   一次レベル

D.   定量レベル

33: 全人口の分類パフォーマンスの状態の信頼を高めるには、次のようにする必要があります。

A.   トレーニングデータセットのサイズを小さくします

B.   トレーニングデータセットのサイズを増やします

C.   テストデータセットのサイズを増やす

D.   テストデータセットのサイズを減らします

34: Google検索エンジンに電力を供給するアルゴリズムは次のとおりです。

A.   adaboost

B.   ブリンページメソッド

C.   googlecrawler

D.   Pagerank

35: 2つの変数間の関連では、前件と結果としての違いは何ですか?

A.   前件は常に非常に複雑な変数です

B.   何も、それらは交換可能です

C.   前件は右側にあり、その結果は左側にあります。

D.   前件は左側にあり、その結果、右

36: 時系列データの分析では、特定の期間にわたる平均値(通常、現在までの過去の間隔)は(n)と呼ばれます。

A.   部分平均

B.   公平な平均

C.   複合平均

D.   移動平均

37: 回帰とは何ですか?

A.   データ項目をいくつかの事前定義されたグループの1つにマッピングする関数を学習します。

B.   FのサブセットFeの事実を説明する言語Lの式e。

C.   データを説明するために有限のカテゴリセットを識別しようとする説明的なタスク。

D.   データ項目を実際の予測変数にマップする関数を学習します。

38: 依存関係モデリングとは何ですか?

A.   データの準備、パターン検索、知識評価、および変更後の反復との改良を含むマルチステッププロセス。

B.   データ項目をいくつかの事前定義されたグループまたはクラスターの1つにマッピングする関数を学習します。

C.   変数間の重要な依存関係を説明するモデルを見つけるプロセス

D.   データからデータベース内のすべての変数/フィールドのジョイント多変数確率密度関数を推定するための手法で構成されるタスク。

39: これらのうち、レイヤーの一般的な説明ではないものはどれですか?

A.   隠れた

B.   入力

C.   出力

D.   機能的

40: シャードとは、次のことを指します。

A.   データベース内のノイズの尺度'の内容

B.   さまざまなサーバー全体に配布するためのデータベースを分割する

C.   同時にSSHを介して複数のオブジェクトデータベースにアクセスします

D.   上記のどれでもない

41: 変更と偏差検出とは何ですか?

A.   以前に測定された値または規範的値からデータの最も重要な変更を発見することに焦点を当てたタスク

B.   データのサブセットのコンパクトな説明を見つける方法。

C.   変数間の重要な依存関係を説明するモデルを見つけるプロセス

D.   データからデータベース内のすべての変数/フィールドのジョイント多変数確率密度関数を推定するための手法で構成されるタスク。

42: Amazon.comの推奨システムを駆動するデータマイニングの種類は何ですか?

A.   ファジーロジック

B.   協会学習

C.   異常検出

D.   クラスタリングアルゴリズム

43: 次のアルゴリズムのうち、一般に監視されていない学習タスクに適しているのはどれですか?

A.   制限付きボルツマンマシン

B.   情報ファジーネットワーク

C.   k-nearest Neighbor

D.   k-meansアルゴリズム

44: メンバーがすべて同じ属性を持っているわけではない半構造化されたデータセットに最も適している次のストレージソリューションのうちどれが最も適切ですか?

A.   mongodb

B.   sqlite

C.   mysql

D.   Mariadb

45: 全人口の分類パフォーマンスを推定するには、_______が必要です

A.   (どれでもない)

B.   馬鹿げたトレーニング

C.   テストデータセット

D.   分離トレーニングとテストデータセット

46: 一般化エラーは結果です

A.   オーバーフィット

B.   パラメトリック分析

C.   アンダーフィット

D.   定義が不十分なチェルノフバウンド

47: これらのうち、進化的計算方法はどれですか?

A.   ヒューリスティックアルゴリズム

B.   ベイジアン推論アルゴリズム

C.   遺伝的アルゴリズム

D.   クラスタリングアルゴリズム

48: サポートベクターマシンは、SVM' Sは

A.   上記のどれでもない

B.   オンライン学習を介してトレーニングが簡単です

C.   局所的な最小収束により抵抗する

D.   パラメトリック

49: 次のうち、一般的なソースシステムではないものはどれですか?

A.   ノード

B.   SAPソース

C.   UDC

D.   DB接続

50: 履歴データセットで最も類似したKレコードのクラスの組み合わせに基づいて、データセット内の各レコードを分類する手法は次のとおりです。

A.   最近隣人

B.   ロジスティック回帰

C.   協会モデルクエリ

D.   決定ツリー

51: 統計的有意性に基づいてデータからの有用なルールの抽出は何ですか?

A.   予備的な方法マッピング

B.   ルール誘導

C.   ファジーロジックアプリケーション

D.   動的な情報推論

52: 分類とは何ですか?

A.   データのサブセットのコンパクトな説明を見つける方法。

B.   データ項目をいくつかの事前定義されたグループの1つにマッピングする関数を学習します。

C.   ある程度の確実性を持つ新しいデータに当てはまる発見されたパターンがあり、他のデータに一般化されます。

D.   データを説明するために有限のカテゴリセットを識別しようとする説明的なタスク。

53: 次のうち、データウェアハウスの関数ではないものはどれですか?

A.   汚れたデータのクリーニング

B.   データの抽出

C.   クリーニングデータ

D.   購入したデータを保存します

54: 正しいか間違っているか? Marsアルゴリズムはルールを作成できません。

A.   真実

B.   間違い

55: 次のうち、お互いの友人ではないソーシャルグラフで2人を結びつける友人の最短のチェーンを見つけるのに最も適切なのはどれですか?

A.   k-meansアルゴリズム

B.   マルコフチェーン

C.   dijkstra' sアルゴリズム

D.   ニューラルネットワーク

56: 次のうち、KDDプロセスの共通の目標ではありません。

A.   説明

B.   パフォーマンス

C.   予測

57: 遺伝的アルゴリズムとは何ですか?

A.   人工変異、クロスオーバー、選択などの操作を実行することにより、バイナリ文字列の初期ランダム集団を処理することにより、最適なバイナル文字列を見つけることができる検索アルゴリズム。

B.   特定のパターン(モデルとそのパラメーター)がKDDプロセスの基準をどの程度適切に満たしているかを推定するアルゴリズム。予測精度(妥当性)の評価は、相互検証に基づいています。記述品質の評価には、予測的なaが含まれます

C.   頻繁なアイテムセットマイニングとトランザクションデータベースを介したアソシエーションルール学習のための古典的なアルゴリズム。データベース内の頻繁な個々のアイテムを識別し、それらのアイテムをs限りて大きくて大きなアイテムセットに拡張することで進行します

58: 興味深いものは何ですか?

A.   パターン値の全体的な尺度、有効性、斬新、有用性、およびシンプルさを組み合わせます。

B.   FのサブセットFeの事実を説明する言語Lの式e。

C.   データの準備、パターン検索、知識評価、および変更後の反復との改良を含むマルチステッププロセス。

D.   ある程度の確実性を持つ新しいデータに当てはまる発見されたパターンがあり、他のデータに一般化されます。

59: MapReduceモデルでは、機能をマップして削減し、どの種類のデータ構造に基づいて機能しますか?

A.   mysqlマトリックス

B.   リンクリスト

C.   リレーショナルデータベース

D.   キー価値ペア

60: 自然言語処理では、語彙分析器の役割は何ですか?

A.   トークンの妥当性をチェックします

B.   入力文字のストリームをトークンに分割します

C.   コンテキストのない文法を生成します

D.   セマンティックな意味のために解析ツリーを処理します

61: クラスタリングとは何ですか?

A.   データからデータベース内のすべての変数/フィールドのジョイント多変数確率密度関数を推定するための手法で構成されるタスク。

B.   データを説明するために有限のカテゴリセットを識別しようとする説明的なタスク。

C.   データ項目をいくつかの事前定義されたグループまたはクラスターの1つにマッピングする関数を学習します。

D.   変数間の重要な依存関係を説明するモデルを見つけるプロセス

62: DBMSは、データの冗長性と矛盾を減らします

A.   データ辞書を利用します

B.   分離プログラムとデータ

C.   繰り返しのデータで孤立したファイルを最小化します

D.   参照整合性の強制

63: コホネン機能マップは、どのタイプの分析で採用されていますか?

A.   記述モデリング分析

B.   クラスター分析

C.   探索的データ分析

D.   予測分析

64: 次のクラスタリングアルゴリズムのどれがojbective関数を最適化できるものはどれですか?

65: 歴史的パターンと将来の傾向に関する洞察を提供するために変換された情報は、次のように知られています。

A.   線形回帰

B.   クラスタリング

C.   知識

D.   メタダタ

66: 次のプロパティのうち、単一層のパーセプロンに適用されるものはどれですか?

A.   誤差逆伝播法

B.   重量のランダムな無効化

C.   連続出力

D.   非線形分離を学ぶことができます

67: 次のうち、複数のモデルをアンサンブルモデルに組み合わせる方法ではないものはどれですか?

A.   投票

B.   スタッキング

C.   平均化

D.   ブートストラップ

68: 要約とは何ですか?

A.   以前に測定された値または規範的値からデータの最も重要な変更を発見することに焦点を当てたタスク

B.   データを説明するために有限のカテゴリセットを識別しようとする説明的なタスク。

C.   変数間の重要な依存関係を説明するモデルを見つけるプロセス

D.   データのサブセットのコンパクトな説明を見つける方法。

69: "ハードウェアストアでの購入の2%で、ピックとシャベルの両方が購入されました。

A.   検証

B.   サポート

C.   監視された学習

D.   トポロジー

70: 多層ニューラルネットワーク出力のステップ関数に一般的に使用される連続的な代替

A.   ロジスティック関数

B.   多層NNは連続出力を計算できません

C.   双曲線関数

D.   対数関数

71: 豚とは

A.   Hadoopがデータウェアハウスとして動作できるようにするプログラミング言語。

B.   どれでもない

C.   Hadoopで作業する一般的なタスクを簡素化するプログラミング言語。

72: データの複数のランダムサンプルを取得し、それぞれの分類モデルを構築することは、次のように知られています。

A.   ファジーサンプリング

B.   ビニング

C.   ブースト

D.   クラスタリング

73: どのXpathセレクター式がフォームのすべてのリンク要素をキャプチャするか' http://example.com/profile/12345' ' http://example.com/casenumber/12345のすべてのリンクを除外しながらHTMLページで?

A.   // a/[contains(@href、" profile")]

B.   // a/[contains(@href、" profile")]/@href

C.   // HREF/プロファイル

D.   // A/プロファイル

74: 次のアルゴリズムのうち、決定ツリーを生成するのはどれですか?

A.   dbscan

B.   id3

C.   上記のどれでもない

D.   ロジスティック回帰

75: 次のプロパティのうち、安らかなアプリケーションの制約はどれですか?

A.   ステートレス

B.   直線的に分離可能

C.   JSON出力を返します

D.   ステートフル

76: メタデータの保存を担当するHadoop分散ファイルシステムのコンポーネントは、

A.   データノード

B.   FSシェル

C.   dfsadmin

D.   nameNode

77: 複数の値が同じ回数が発生した場合、データは次のとおりです。

A.   多面

B.   マルチリーフ

C.   多変量

D.   マルチモーダル

78: ビジネス理解フェーズの最初のステップは何ですか?

A.   ビジネスの目標とニーズをしっかりと把握する

B.   リソース、仮定、制約などを見つけることにより、現在の状況を評価します。

C.   データマイニングの目標を作成して、ビジネス目標を達成します

D.   タスクに適用されるすべての関連するアルゴリズムのリストを作成します

79: カールとは何ですか?

A.   ファイルを取得するためのコマンドラインツール

B.   データの隠された機能を分類するための方法論

C.   アクセス許可を指定するHTTPの一部

D.   組み合わせ監督なし再帰学習アルゴリズム

80: 何らかの数値スケールを使用して依存関係の強度を指定するモデルのレベル。

A.   数値レベル

B.   一次レベル

C.   依存レベル

D.   定量的レベル

81: Aprioriは、以下を使用して頻繁にアイテムセットを見つけるための独創的なアルゴリズムです。

A.   通常の混合モデル

B.   候補者の世代

C.   過剰適合方法

D.   どれでもない

82: 多くの重要なWeb APIで使用される認証プロトコルは、次のように呼ばれます。

A.   https

B.   PGP

C.   oauth

D.   SSL

83: これらのどれがKDDプロセスのステップではありませんか?

A.   データ統合

B.   データマイニング

C.   データクリーニング

D.   データの定量化

84: 通常、次のアプリケーションのうち、学生を分類するために使用されるのはどれですか'パフォーマンス?

A.   クラスター分析

B.   if ... then ...分析

C.   回帰分析

D.   市場バスケット分析

85: 意味のある平均値を持つ数値データセットでは、平均のN標準偏差内に該当するデータの最小割合は何ですか?

A.   1/n^2

B.   1/n

C.   1-1/n^2

D.   1/2n

86: カテゴリターゲット変数のモデリングに使用できるメソッドは次のうちどれですか?

A.   上記のすべて

B.   ロジスティック回帰

C.   アリマ

D.   非線形回帰

E.   回帰

87: 次のうち、Hadoop還元剤の主要な段階ではないものはどれですか?

A.   選別

B.   減らす

C.   地図

D.   シャッフル

88: これらのどれがデータマイニングシステムの可能性のあるアーキテクチャですか?

A.   カップリングなし

B.   磁気結合

C.   推移的な結合

D.   クイックスタートカップリング

89: 正しいか間違っているか?人工ニューラルネットワークは、線形予測モデルです。

A.   真実

B.   間違い

90: モデルとその予測の間の測定された違いは、次のように知られています。

A.   ノイズ

B.   外れ値

C.   範囲

D.   適用可能なデータ

91: ハッシュベースの手法、トランザクションの削減、ポーション、サンプリング、および動的アイテムカウントはすべて、何の例ですか?

A.   Aprioriアルゴリズムの効率を向上させる手法

B.   データベースを繰り返しスキャンし、パターンマッチングによって大量の候補セットを確認する方法。

C.   候補者の生成なしで頻繁なアイテムセットを生成する方法。

D.   データのサブセットのコンパクトな説明を見つける方法。

92: 次のうち、小売顧客データマイニング戦略の一部はどれですか?

A.   顧客の声

B.   ホリデーセール

C.   返金保証

D.   ロイヤルティカード

93: 分類ツリーを計算するときに、どの決定ツリーメソッドがマルチレベルスプリットを実行しますか?

A.   ID3(反復二分筋3)

B.   C4.5アルゴリズム

C.   カート(分類および回帰ツリー)

D.   Chaid(Chi Square Automatic Interaction Detection)

94: K-Means Clustering(Lloyd' s)アルゴリズムよりもK-Medoidsクラスタリングアルゴリズムの利点は何ですか?

A.   反復洗練を使用します

B.   外れ値により耐性がある

C.   上記のすべて

D.   中央のクラスターを表します

95: BIサーバーの2つの主要な機能は次のとおりです。

A.   処理と管理

B.   ソースと結果

C.   管理と配信

D.   アプリケーションと配信

96: 次のうち、JavaScript/Ajaxコールを介してデータベースにアクセスするWebサイトからデータを収穫するための適切なツールではないものはどれですか?

A.   上記のすべてが適切です

B.   セレン

C.   ファントムジ

D.   wget

97: データベース内の値間の関係を特定するのに役立つデータを探索するための記述的アプローチは次のとおりです。

A.   予測分析

B.   関数の活性化

C.   リンク分析

D.   クラスタリング

98: アソシエーションパターンで興味深さをどのように測定しますか?

A.   分散を測定します

B.   関連性を測定します

C.   ミーアの精度

D.   リフトを測定

99: 次のうち、JSONが有効でないものはどれですか?

A.   {"回答":"この1つ"}

B.   {"回答":["この1つ"]}

C.   {[" Answer":" This One"]}

D.   すべて有効です

100: ウェブサイトオペレーターは通常、顧客に関するデータを見つけることができます。 IPアドレス?

A.   HTTP要求ヘッダー

B.   クッキー

C.   サーバーログファイル

D.   上記のすべて