Questions de Data Mining en langues françaises

Questions de Data Mining en langues françaises

Ces questions et réponses à choix multiples sur l'exploration de données vous aideront à mieux comprendre les sujets d'exploration de données. Préparez-vous pour votre prochain examen ou entretien avec ces plus de 100 collections de données QCM.
Faites défiler vers le bas pour commencer à répondre.

1: Quelle industrie peut bénéficier de l'exploration de données?

A.   Tous ces

B.   Détail

C.   Fabrication

D.   Finance / banque

2: Avec laquelle de ces couches un réseau neuronal commence-t-il?

A.   Couche de sortie

B.   Couche cachée

C.   Couche transparente

D.   Couche d'entrée

3: Les modifications des parties d'un code pourraient entraîner le problème des données ______________.

A.   inconsistant

B.   sale

C.   non intégré

D.   granulaire

4: Dans un filet neuronal, à quoi se référait la topologie?

A.   La gamme de variables dans un ensemble

B.   Le nombre de nœuds utilisés

C.   La visualisation graphique des données

D.   Le nombre de couches et le nombre de nœuds dans chaque couche

5: Lequel des algorithmes de clustering suivants peut trouver des grappes de forme arbitraire?

A.   Liaison unique

B.   Dsbscan

C.   Ces deux

D.   Aucun d'eux

6: Les arbres de décision sont capables de gérer les valeurs manquantes sans utiliser de transformation impute. Vrai ou faux?

A.   FAUX

B.   Vrai

7: Un algorithme (n) _____ crée des règles qui décrivent la fréquence à laquelle les événements se sont produits ensemble.

A.   Chaid

B.   artificiel

C.   taille

D.   associatif

8: Lequel des éléments suivants est un XML valide?

A.   & lt; Body Answer = & # 34; valide & # 34; & gt; celui-ci & lt; / body & gt;

B.   & lt; valide & gt; celui-ci & lt; / valide & gt;

C.   & lt; valid & gt; & # 34; celui-ci & # 34; & lt; / valid & gt;

D.   Tous sont valides

9: Lequel des éléments suivants n'est pas une base de données relationnelle?

A.   Tout ce qui précède

B.   Apache Cassandra

C.   Big Table Google

D.   Mongodb

10: Qu'est-ce que la visualisation des données?

A.   Le terme technique pour l'acte de données stocké dans un serveur

B.   Une prédiction structurée et développée des résultats des données

C.   L'interprétation visuelle des relations complexes dans les données multidimensionnelles

11: Qu'est-ce qu'un processus KDD?

A.   Décryptage différentiel

B.   Knoop-hardness mesuré par une dimension à fort impact

C.   Découverte de connaissances dans les bases de données

D.   K-Mean Data Discovery

12: Lesquels ne sont pas des types de logiciels analytiques:

A.   Tous sont des types valides

B.   Réseau neuronal

C.   Statistique

D.   Apprentissage automatique

13: Vrai ou faux? Les indicateurs économiques sont des facteurs de données externes.

A.   FAUX

B.   Vrai

14: Laquelle des disciplines suivantes chevauche l'exploration de données?

A.   Tout ce qui précède

B.   Intelligence artificielle

C.   Statistiques

D.   Linguistique

15: Dans les modèles prédictifs, les valeurs ou les classes à prédire sont appelées:

A.   Dépendant

B.   Tous ces

C.   Réponse

D.   Variables cibles

16: Vous êtes un gestionnaire de risques de crédit d'une banque de vente au détail. Certaines informations sur les clients sont disponibles pour l'analyse. Sur la base de ces données, vous devez décider qu'une personne sera un bon ou un mauvais client. Choisissez la tâche d'exploration de données appropriée pour ces problèmes commerciaux.

A.   Classification

B.   Régression

C.   Segmentation

17: Les éléments de données regroupés en relations et préférences sont connues:

A.   Ensembles prévisibles

B.   Organisations passantes

C.   Degrés d'ajustement

D.   Groupes

18: Que sont les arbres de décision?

A.   Des rapports complexes générés par un data scientifique qualifié

B.   Dimensions hiérarchiques qui peuvent être créées avec un navigateur Hyper Cube

C.   Données non collectées par l'organisation, telles que les données disponibles à partir d'un livre de référence

D.   Structures qui génèrent des règles pour la classification d'un ensemble de données

19: Quelles sont les méthodes d'exploration de données populaires?

A.   Modèles d'apprentissage relationnel

B.   Arbres et règles de décision

C.   Tous ces

D.   Modèles de dépendance graphique probabiliste

20: Vrai de faux? L'architecture d'exploration de données de couplage lâche est principalement pour les systèmes d'exploration de données basés sur la mémoire qui ne nécessitent pas d'évolutivité élevée et de performances élevées.

A.   FAUX

B.   Vrai

21: Qu'est-ce que Crisp-DM?

A.   Un arbre de décision développé dans les années 1980 mais presque entièrement remplacés par la méthode CART aujourd'hui

B.   Une méthode en six phases pour prédire les habitudes d'achat du commerce électronique

C.   Algorithme de régression linéaire de Microsoft

D.   Un processus standard de l'industrie croisée pour l'exploration de données

22: Une fonction utilisée par un nœud dans un filet neuronal pour transformer les données d'entrée de n'importe quel domaine de valeurs en une plage finie de valeurs est appelée (n):

A.   Antécédent

B.   Fonction d'activation

C.   Matrice de confusion

D.   Chi carré

23: Vrai ou faux? Les tests en panier sont toujours binaires.

A.   Vrai

B.   FAUX

24: Quelle est la mesure de la façon dont deux variables aléatoires changent ensemble?

A.   écart-type binaire

B.   Covariance

C.   polyconvergence

D.   inertie stochastique

25: Lequel de ceux-ci est un exemple d'une relation de modèle séquentielle?

A.   Utilisation de l'expérience commerciale et de l'intestint pour concevoir un nouveau plan d'étage dans une épicerie

B.   Réorganisation de votre équipe de départ de votre équipe de basket-ball basée sur une analyse des performances

C.   Placer deux articles fréquemment achetés l'un à côté de l'autre sur l'étagère

D.   Prédire la probabilité qu'un sac à dos soit acheté en fonction d'un achat de consommateur de sacs de couchage et de chaussures de randonnée

26: Les revenus annuels d'une entreprise internationale sont corrélés avec d'autres attributs tels que la publicité, le taux de change, le taux d'inflation, etc. ayant ces valeurs (ou leurs estimations fiables pour l'année prochaine), la société doit calculer ses revenus attendus pour l'année prochaine. Choisissez la tâche d'exploration de données appropriée pour ce problème commercial.

A.   Segmentation

B.   Classification

C.   Régression

27: Quelle est la couche frontale de l'architecture d'exploration de données?

A.   Une interface utilisateur intuitive et conviviale

B.   Pare-feu établis pour protéger les données contre des sources malveillantes

C.   Le matériel conçu spécifiquement pour le stockage de quantités massives de données

D.   L'équipe de programmeurs qui ont conçu le logiciel utilisé dans un projet minier particulier

28: Un hyperplan est un

A.   Décision Limite séparant les classes de données

B.   variante de l'algorithme C4.5

C.   Collection de fichiers hypertextes liés

D.   condition d'erreur non terminante

29: Les données non collectées par l'organisation, telles que les données d'une base de données propriétaires, qui sont combinées avec les propres données de l'organisation est connue:

A.   Superposition

B.   Sur-ajustement

C.   Bruit

D.   Date non applicable

30: Lesquels ne sont pas considérés comme des facteurs de données internes?

A.   Prix

B.   Ralentissement économique

C.   Compétences du personnel

D.   Positionnement de produit

31: Quelle technique d'exploration de données organise des ensembles de données en groupes prédéfinis?

A.   Strouille séquentielle

B.   Regroupement

C.   Classification

D.   Gamification

32: Le niveau du modèle qui spécifie (souvent graphiquement) quelles variables dépendent localement les unes des autres.

A.   Niveau structurel

B.   Niveau qualitatif

C.   Niveau primaire

D.   Niveau quantitatif

33: Pour accroître la confiance de votre état de performance de classification sur l'ensemble de la population, vous devez:

A.   Diminuer la taille de l'ensemble de données de formation

B.   Augmenter la taille de l'ensemble de données de formation

C.   Augmentez la taille de l'ensemble de données de test

D.   Diminuer la taille de l'ensemble de données de test

34: L'algorithme alimentaire le moteur de recherche Google est:

A.   Adaboost

B.   La méthode de la pages brin

C.   Googlecrawler

D.   Classement

35: Dans l'association entre deux variables, quelle est la différence entre l'antécédent et la conséquence?

A.   L'anticédent est toujours une variable très complexe

B.   Rien, ils sont interchangeables

C.   L'antécédent est à droite, la conséquente est à gauche.

D.   L'antécédent est à gauche, le conséquent à droite

36: Dans l'analyse des données des séries chronologiques, la valeur moyenne sur une période de temps donnée (généralement un intervalle dans le passé jusqu'à présent) est appelée (n)

A.   moyenne partielle

B.   moyenne impartiale

C.   moyenne composée

D.   moyenne mobile

37: Qu'est-ce que la régression?

A.   Apprendre une fonction qui mappe un élément de données dans l'un des nombreux groupes prédéfinis.

B.   Une expression e dans une langue l décrivant les faits dans un sous-ensemble Fe de F.

C.   Une tâche descriptive où l'on cherche à identifier un ensemble fini de catégories pour décrire les données.

D.   Apprendre une fonction qui mappe un élément de données à une variable de prédiction à valeur réelle.

38: Qu'est-ce que la modélisation des dépendances?

A.   Un processus en plusieurs étapes impliquant la préparation des données, la recherche de modèles, l'évaluation des connaissances et le raffinement avec itération après modification.

B.   Apprendre une fonction qui mappe un élément de données dans l'un des nombreux groupes ou clusters prédéfinis.

C.   Le processus de recherche d'un modèle qui décrit des dépendances significatives entre les variables

D.   Une tâche qui se compose de techniques d'estimation, à partir des données, la fonction conjointe de densité de probabilité multi-variées de toutes les variables / champs de la base de données.

39: Laquelle de celles-ci n'est pas une descriptions communes des couches?

A.   Caché

B.   Saisir

C.   Sortir

D.   Fonctionnel

40: Le Sharding fait référence à:

A.   Une mesure du bruit dans une base de données du contenu

B.   partition d'une base de données pour la distribution sur différents serveurs

C.   Accédant simultanément à plusieurs bases de données d'objets sur SSH

D.   Aucune de ces réponses

41: Qu'est-ce que la détection du changement et de la déviation?

A.   Une tâche axée sur la découverte des changements les plus significatifs dans les données des valeurs précédemment mesurées ou normatives

B.   Méthodes pour trouver une description compacte pour un sous-ensemble de données.

C.   Le processus de recherche d'un modèle qui décrit des dépendances significatives entre les variables

D.   Une tâche qui se compose de techniques d'estimation, à partir des données, la fonction conjointe de densité de probabilité multi-variées de toutes les variables / champs de la base de données.

42: Quel est le type d'exploration de données qui pilote le système de recommandation Amazon.com?

A.   Logique floue

B.   Association Apprentissage

C.   Détection d'une anomalie

D.   Algorithmes de regroupement

43: Lequel des algorithmes suivants convient généralement aux tâches d'apprentissage non supervisées?

A.   Machine Boltzmann restreinte

B.   Réseaux d'info-Fuzzy

C.   voisin k-nearest

D.   K-means algorithme

44: Laquelle des solutions de stockage suivantes est la plus appropriée pour un ensemble de données semi-structuré dont les membres n'ont pas tous les mêmes attributs?

A.   MongoDB

B.   Sqlite

C.   Mysql

D.   Mariadb

45: Afin d'estimer les performances de classification sur une population entière, vous avez besoin de _______

A.   (Aucun d'eux)

B.   Formation disjointe

C.   Ensembles de données de test

D.   Ensembles de données de formation et de test disjoints

46: L'erreur de généralisation est une conséquence de

A.   Surfit

B.   Analyse paramétrique

C.   Sous-forme

D.   Chernoff lié à Cheroff mal défini

47: Lesquelles de ces méthodes de calcul évolutives?

A.   Algorithmes heuristiques

B.   Algorithmes d'inférence bayésienne

C.   Algorithmes génétiques

D.   Algorithmes de regroupement

48: Les machines vectorielles de support ont un avantage sur les réseaux de neurones car SVM & # 39; s sont

A.   Aucune de ces réponses

B.   plus facile à s'entraîner via l'apprentissage en ligne

C.   plus résistant aux minima locaux de convergence

D.   paramétrique

49: Lequel des éléments suivants n'est pas un système source commun?

A.   Nœud

B.   Source SAP

C.   UDC

D.   DB Connect

50: Une technique qui classe chaque enregistrement dans un ensemble de données basé sur une combinaison des classes du ou des enregistrements K le plus similaire dans un ensemble de données historique est:

A.   Voisin le plus proche

B.   Régression logistique

C.   Requête du modèle d'association

D.   Arbre de décision