Questions de Data Mining en langues françaises

Ces questions et réponses à choix multiples sur l'exploration de données vous aideront à mieux comprendre les sujets d'exploration de données. Préparez-vous pour votre prochain examen ou entretien avec ces plus de 100 collections de données QCM.
Faites défiler vers le bas pour commencer à répondre.

1: Quelle industrie peut bénéficier de l'exploration de données?

A. Tous ces

B. Détail

C. Fabrication

D. Finance / banque

2: Avec laquelle de ces couches un réseau neuronal commence-t-il?

A. Couche de sortie

B. Couche cachée

C. Couche transparente

D. Couche d'entrée

3: Les modifications des parties d'un code pourraient entraîner le problème des données ______________.

A. inconsistant

B. sale

C. non intégré

D. granulaire

4: Dans un filet neuronal, à quoi se référait la topologie?

A. La gamme de variables dans un ensemble

B. Le nombre de nœuds utilisés

C. La visualisation graphique des données

D. Le nombre de couches et le nombre de nœuds dans chaque couche

5: Lequel des algorithmes de clustering suivants peut trouver des grappes de forme arbitraire?

A. Liaison unique

B. Dsbscan

C. Ces deux

D. Aucun d'eux

6: Les arbres de décision sont capables de gérer les valeurs manquantes sans utiliser de transformation impute. Vrai ou faux?

A. FAUX

B. Vrai

7: Un algorithme (n) _____ crée des règles qui décrivent la fréquence à laquelle les événements se sont produits ensemble.

A. Chaid

B. artificiel

C. taille

D. associatif

8: Lequel des éléments suivants est un XML valide?

A. & lt; Body Answer = & # 34; valide & # 34; & gt; celui-ci & lt; / body & gt;

B. & lt; valide & gt; celui-ci & lt; / valide & gt;

C. & lt; valid & gt; & # 34; celui-ci & # 34; & lt; / valid & gt;

D. Tous sont valides

9: Lequel des éléments suivants n'est pas une base de données relationnelle?

A. Tout ce qui précède

B. Apache Cassandra

C. Big Table Google

D. Mongodb

10: Qu'est-ce que la visualisation des données?

A. Le terme technique pour l'acte de données stocké dans un serveur

B. Une prédiction structurée et développée des résultats des données

C. L'interprétation visuelle des relations complexes dans les données multidimensionnelles

11: Qu'est-ce qu'un processus KDD?

A. Décryptage différentiel

B. Knoop-hardness mesuré par une dimension à fort impact

C. Découverte de connaissances dans les bases de données

D. K-Mean Data Discovery

12: Lesquels ne sont pas des types de logiciels analytiques:

A. Tous sont des types valides

B. Réseau neuronal

C. Statistique

D. Apprentissage automatique

13: Vrai ou faux? Les indicateurs économiques sont des facteurs de données externes.

A. FAUX

B. Vrai

14: Laquelle des disciplines suivantes chevauche l'exploration de données?

A. Tout ce qui précède

B. Intelligence artificielle

C. Statistiques

D. Linguistique

15: Dans les modèles prédictifs, les valeurs ou les classes à prédire sont appelées:

A. Dépendant

B. Tous ces

C. Réponse

D. Variables cibles

16: Vous êtes un gestionnaire de risques de crédit d'une banque de vente au détail. Certaines informations sur les clients sont disponibles pour l'analyse. Sur la base de ces données, vous devez décider qu'une personne sera un bon ou un mauvais client. Choisissez la tâche d'exploration de données appropriée pour ces problèmes commerciaux.

A. Classification

B. Régression

C. Segmentation

17: Les éléments de données regroupés en relations et préférences sont connues:

A. Ensembles prévisibles

B. Organisations passantes

C. Degrés d'ajustement

D. Groupes

18: Que sont les arbres de décision?

A. Des rapports complexes générés par un data scientifique qualifié

B. Dimensions hiérarchiques qui peuvent être créées avec un navigateur Hyper Cube

C. Données non collectées par l'organisation, telles que les données disponibles à partir d'un livre de référence

D. Structures qui génèrent des règles pour la classification d'un ensemble de données

19: Quelles sont les méthodes d'exploration de données populaires?

A. Modèles d'apprentissage relationnel

B. Arbres et règles de décision

C. Tous ces

D. Modèles de dépendance graphique probabiliste

20: Vrai de faux? L'architecture d'exploration de données de couplage lâche est principalement pour les systèmes d'exploration de données basés sur la mémoire qui ne nécessitent pas d'évolutivité élevée et de performances élevées.

A. FAUX

B. Vrai

21: Qu'est-ce que Crisp-DM?

A. Un arbre de décision développé dans les années 1980 mais presque entièrement remplacés par la méthode CART aujourd'hui

B. Une méthode en six phases pour prédire les habitudes d'achat du commerce électronique

C. Algorithme de régression linéaire de Microsoft

D. Un processus standard de l'industrie croisée pour l'exploration de données

22: Une fonction utilisée par un nœud dans un filet neuronal pour transformer les données d'entrée de n'importe quel domaine de valeurs en une plage finie de valeurs est appelée (n):

A. Antécédent

B. Fonction d'activation

C. Matrice de confusion

D. Chi carré

23: Vrai ou faux? Les tests en panier sont toujours binaires.

A. Vrai

B. FAUX

24: Quelle est la mesure de la façon dont deux variables aléatoires changent ensemble?

A. écart-type binaire

B. Covariance

C. polyconvergence

D. inertie stochastique

25: Lequel de ceux-ci est un exemple d'une relation de modèle séquentielle?

A. Utilisation de l'expérience commerciale et de l'intestint pour concevoir un nouveau plan d'étage dans une épicerie

B. Réorganisation de votre équipe de départ de votre équipe de basket-ball basée sur une analyse des performances

C. Placer deux articles fréquemment achetés l'un à côté de l'autre sur l'étagère

D. Prédire la probabilité qu'un sac à dos soit acheté en fonction d'un achat de consommateur de sacs de couchage et de chaussures de randonnée

26: Les revenus annuels d'une entreprise internationale sont corrélés avec d'autres attributs tels que la publicité, le taux de change, le taux d'inflation, etc. ayant ces valeurs (ou leurs estimations fiables pour l'année prochaine), la société doit calculer ses revenus attendus pour l'année prochaine. Choisissez la tâche d'exploration de données appropriée pour ce problème commercial.

A. Segmentation

B. Classification

C. Régression

27: Quelle est la couche frontale de l'architecture d'exploration de données?

A. Une interface utilisateur intuitive et conviviale

B. Pare-feu établis pour protéger les données contre des sources malveillantes

C. Le matériel conçu spécifiquement pour le stockage de quantités massives de données

D. L'équipe de programmeurs qui ont conçu le logiciel utilisé dans un projet minier particulier

28: Un hyperplan est un

A. Décision Limite séparant les classes de données

B. variante de l'algorithme C4.5

C. Collection de fichiers hypertextes liés

D. condition d'erreur non terminante

29: Les données non collectées par l'organisation, telles que les données d'une base de données propriétaires, qui sont combinées avec les propres données de l'organisation est connue:

A. Superposition

B. Sur-ajustement

C. Bruit

D. Date non applicable

30: Lesquels ne sont pas considérés comme des facteurs de données internes?

A. Prix

B. Ralentissement économique

C. Compétences du personnel

D. Positionnement de produit

31: Quelle technique d'exploration de données organise des ensembles de données en groupes prédéfinis?

A. Strouille séquentielle

B. Regroupement

C. Classification

D. Gamification

32: Le niveau du modèle qui spécifie (souvent graphiquement) quelles variables dépendent localement les unes des autres.

A. Niveau structurel

B. Niveau qualitatif

C. Niveau primaire

D. Niveau quantitatif

33: Pour accroître la confiance de votre état de performance de classification sur l'ensemble de la population, vous devez:

A. Diminuer la taille de l'ensemble de données de formation

B. Augmenter la taille de l'ensemble de données de formation

C. Augmentez la taille de l'ensemble de données de test

D. Diminuer la taille de l'ensemble de données de test

34: L'algorithme alimentaire le moteur de recherche Google est:

A. Adaboost

B. La méthode de la pages brin

C. Googlecrawler

D. Classement

35: Dans l'association entre deux variables, quelle est la différence entre l'antécédent et la conséquence?

A. L'anticédent est toujours une variable très complexe

B. Rien, ils sont interchangeables

C. L'antécédent est à droite, la conséquente est à gauche.

D. L'antécédent est à gauche, le conséquent à droite

36: Dans l'analyse des données des séries chronologiques, la valeur moyenne sur une période de temps donnée (généralement un intervalle dans le passé jusqu'à présent) est appelée (n)

A. moyenne partielle

B. moyenne impartiale

C. moyenne composée

D. moyenne mobile

37: Qu'est-ce que la régression?

A. Apprendre une fonction qui mappe un élément de données dans l'un des nombreux groupes prédéfinis.

B. Une expression e dans une langue l décrivant les faits dans un sous-ensemble Fe de F.

C. Une tâche descriptive où l'on cherche à identifier un ensemble fini de catégories pour décrire les données.

D. Apprendre une fonction qui mappe un élément de données à une variable de prédiction à valeur réelle.

38: Qu'est-ce que la modélisation des dépendances?

A. Un processus en plusieurs étapes impliquant la préparation des données, la recherche de modèles, l'évaluation des connaissances et le raffinement avec itération après modification.

B. Apprendre une fonction qui mappe un élément de données dans l'un des nombreux groupes ou clusters prédéfinis.

C. Le processus de recherche d'un modèle qui décrit des dépendances significatives entre les variables

D. Une tâche qui se compose de techniques d'estimation, à partir des données, la fonction conjointe de densité de probabilité multi-variées de toutes les variables / champs de la base de données.

39: Laquelle de celles-ci n'est pas une descriptions communes des couches?

A. Caché

B. Saisir

C. Sortir

D. Fonctionnel

40: Le Sharding fait référence à:

A. Une mesure du bruit dans une base de données du contenu

B. partition d'une base de données pour la distribution sur différents serveurs

C. Accédant simultanément à plusieurs bases de données d'objets sur SSH

D. Aucune de ces réponses

41: Qu'est-ce que la détection du changement et de la déviation?

A. Une tâche axée sur la découverte des changements les plus significatifs dans les données des valeurs précédemment mesurées ou normatives

B. Méthodes pour trouver une description compacte pour un sous-ensemble de données.

C. Le processus de recherche d'un modèle qui décrit des dépendances significatives entre les variables

42: Quel est le type d'exploration de données qui pilote le système de recommandation Amazon.com?

A. Logique floue

B. Association Apprentissage

C. Détection d'une anomalie

D. Algorithmes de regroupement

43: Lequel des algorithmes suivants convient généralement aux tâches d'apprentissage non supervisées?

A. Machine Boltzmann restreinte

B. Réseaux d'info-Fuzzy

C. voisin k-nearest

D. K-means algorithme

44: Laquelle des solutions de stockage suivantes est la plus appropriée pour un ensemble de données semi-structuré dont les membres n'ont pas tous les mêmes attributs?

A. MongoDB

B. Sqlite

C. Mysql

D. Mariadb

45: Afin d'estimer les performances de classification sur une population entière, vous avez besoin de _______

A. (Aucun d'eux)

B. Formation disjointe

C. Ensembles de données de test

D. Ensembles de données de formation et de test disjoints

46: L'erreur de généralisation est une conséquence de

A. Surfit

B. Analyse paramétrique

C. Sous-forme

D. Chernoff lié à Cheroff mal défini

47: Lesquelles de ces méthodes de calcul évolutives?

A. Algorithmes heuristiques

B. Algorithmes d'inférence bayésienne

C. Algorithmes génétiques

D. Algorithmes de regroupement

48: Les machines vectorielles de support ont un avantage sur les réseaux de neurones car SVM & # 39; s sont

A. Aucune de ces réponses

B. plus facile à s'entraîner via l'apprentissage en ligne

C. plus résistant aux minima locaux de convergence

D. paramétrique

49: Lequel des éléments suivants n'est pas un système source commun?

A. Nœud

B. Source SAP

C. UDC

D. DB Connect

50: Une technique qui classe chaque enregistrement dans un ensemble de données basé sur une combinaison des classes du ou des enregistrements K le plus similaire dans un ensemble de données historique est:

A. Voisin le plus proche

B. Régression logistique

C. Requête du modèle d'association

D. Arbre de décision

51: Quelle est l'extraction de règles si utiles, alors des données basées sur la signification statistique?

A. Mappage de méthode préliminaire

B. Induction de règle

C. Application logique floue

D. Inférence d'informations dynamiques

52: Qu'est-ce que la classification?

A. Méthodes pour trouver une description compacte pour un sous-ensemble de données.

B. Apprendre une fonction qui mappe un élément de données dans l'un des nombreux groupes prédéfinis.

C. Un modèle découvert qui est vrai sur de nouvelles données avec un certain degré de certitude et se généralise à d'autres données.

D. Une tâche descriptive où l'on cherche à identifier un ensemble fini de catégories pour décrire les données.

53: Lequel des éléments suivants n'est pas fonction des entrepôts de données?

A. Nettoyage des données sales

B. Extraction de données

C. Données de nettoyage

D. Stockage des données achetées

54: Vrai ou faux? L'algorithme Mars ne peut pas produire de règles.

A. Vrai

B. FAUX

A. algorithme de k-means

B. Chaînes de Markov

C. Algorithme de Dijkstra

D. Les réseaux de neurones

56: Lequel des éléments suivants n'est pas un objectif commun du processus KDD:

A. Description

B. Performance

C. Prédiction

57: Qu'est-ce qu'un algorithme génétique?

A. Un algorithme de recherche qui nous permet de localiser une chaîne binaire optimale en traitant une population aléatoire initiale de chaînes binaires en effectuant des opérations telles que la mutation artificielle, le croisement et la sélection.

B. Un algorithme qui estime à quel point un modèle particulier (un modèle et ses paramètres) répond aux critères du processus KDD. L'évaluation de la précision prédictive (validité) est basée sur la validation croisée. L'évaluation de la qualité descriptive implique un prédictif

C. Un algorithme classique pour l'exploration de règles des éléments fréquents et l'apprentissage des règles d'association sur les bases de données transactionnelles. Il procède en identifiant les éléments individuels fréquents dans la base de données et en les étendant à des ensembles d'articles de plus en plus grands tant que ces éléments S

58: Qu'est-ce que l'intérêt?

A. Une mesure globale de la valeur du modèle, combinant la validité, la nouveauté, l'utilité et la simplicité.

B. Une expression e dans une langue l décrivant les faits dans un sous-ensemble Fe de F.

C. Un processus en plusieurs étapes impliquant la préparation des données, la recherche de modèles, l'évaluation des connaissances et le raffinement avec itération après modification.

D. Un modèle découvert qui est vrai sur de nouvelles données avec un certain degré de certitude et se généralise à d'autres données.

59: Dans le modèle MapReduce, la carte et la réduction des fonctions agissent directement sur quel type de structure de données?

A. Matrices MySQL

B. listes liées

C. bases de données relationnelles

D. paire de valeurs clés

60: Dans le traitement du langage naturel, quel est le rôle d'un analyseur lexical?

A. vérifie la validité d'un jeton

B. divise le flux de caractères d'entrée dans les jetons

C. génère une grammaire sans contexte

D. traite l'arbre d'analyse pour le sens sémantique

61: Qu'est-ce que le regroupement?

A. Une tâche qui se compose de techniques d'estimation, à partir des données, la fonction conjointe de densité de probabilité multi-variées de toutes les variables / champs de la base de données.

B. Une tâche descriptive où l'on cherche à identifier un ensemble fini de catégories pour décrire les données.

C. Apprendre une fonction qui mappe un élément de données dans l'un des nombreux groupes ou clusters prédéfinis.

D. Le processus de recherche d'un modèle qui décrit des dépendances significatives entre les variables

62: Un SGBD réduit la redondance des données et l'incohérence par

A. Utilisation d'un dictionnaire de données

B. Programme et données de découplage

C. Minimiser les fichiers isolés avec des données répétées

D. Appliquer l'intégrité référentielle

63: Dans quel type d'analyse une carte de fonctionnalité Kohonen est-elle généralement utilisée?

A. Analyse de modélisation descriptive

B. L'analyse par grappes

C. L'analyse exploratoire des données

D. Analyse prédictive

64: Lequel des algorithmes de clustering FollownG peut optimiser une fonction OJBective?

65: Les informations converties pour fournir des informations sur les modèles historiques et les tendances futures sont connues:

A. Régression linéaire

B. Regroupement

C. Connaissance

D. Métadonnées

66: Laquelle des propriétés suivantes s'applique aux perceptrons à couche unique?

A. étalon

B. Insulalisation aléatoire des poids

C. sortie continue

D. capable d'apprendre des séparations non linéaires

67: Lequel des éléments suivants n'est pas une méthode de combinaison de plusieurs modèles en un modèle d'ensemble?

A. Vote

B. Empilement

C. Moyenne

D. Bootstrap

68: Qu'est-ce que le résumé?

A. Une tâche axée sur la découverte des changements les plus significatifs dans les données des valeurs précédemment mesurées ou normatives

B. Une tâche descriptive où l'on cherche à identifier un ensemble fini de catégories pour décrire les données.

C. Le processus de recherche d'un modèle qui décrit des dépendances significatives entre les variables

D. Méthodes pour trouver une description compacte pour un sous-ensemble de données.

69: & # 34; dans 2% des achats de la quincaillerie, un choix et une pelle ont été achetés », est un exemple de:

A. Validation

B. Soutien

C. Enseignement supervisé

D. Topologie

70: Une alternative continue couramment utilisée à la fonction de pas dans la sortie du réseau neuronal multicouche est la

A. Fonction logistique

B. NN multicouche ne peut pas calculer la sortie continue

C. fonction hyperbolique

D. fonction logarithmique

71: Qu'est-ce que le cochon

A. Un langage de programmation qui permet à Hadoop de fonctionner comme un entrepôt de données.

B. Aucun d'eux

C. Un langage de programmation qui simplifie les tâches courantes de travail avec Hadoop.

72: Prendre plusieurs échantillons aléatoires de données et construire un modèle de classification pour chacun est connu comme:

A. Échantillon flou

B. Rabattement

C. Boosting

D. Regroupement

73: Quelle expression de sélecteur xpath capture tous les éléments de liaison du formulaire & # 39; http: //example.com/profile/12345' Dans une page HTML tout en excluant tous les liens du formulaire & # 39; http: //example.com/casenumber/12345?

A. // a / [contient (@href, & # 34; profil & # 34;)]

B. // a / [contient (@href, & # 34; profil & # 34;)] / @ href

C. // href / profil

D. // a / profil

74: Lequel des algorithmes suivants produit des arbres de décision?

A. Dbscan

B. ID3

C. Aucune de ces réponses

D. régression logistique

75: Laquelle des propriétés suivantes est une contrainte sur une demande RESTful?

A. sans état

B. Sépréteur linéairement

C. Renvoie la sortie JSON

D. avec état

76: Le composant du système de fichiers distribué Hadoop responsable du stockage des métadonnées est appelé le

A. Code de données

B. Shell FS

C. Dfsadmin

D. Namenode

77: Si plusieurs valeurs se produisent le même nombre de fois, les données sont:

A. À multiples facettes

B. À plusieurs feuilles

C. Multivarié

D. Multi-modal

78: Quelle est la première étape de la phase de compréhension des entreprises?

A. Saisissez fermement les objectifs et les besoins de l'entreprise

B. Évaluez la situation actuelle en découvrant les ressources, les hypothèses, les contraintes, etc.

C. Créer des objectifs d'exploration de données pour atteindre les objectifs commerciaux

D. Créez une liste de tous les algorithmes pertinents à appliquer à la tâche

79: Qu'est-ce que Curl?

A. Un outil de ligne de commande pour récupérer les fichiers

B. Une méthodologie pour classer les caractéristiques cachées des données

C. La partie de HTTP qui spécifie l'autorisation d'accès

D. Algorithme combinatoire d'apprentissage récursif non supervisé

80: Le niveau du modèle qui spécifie les forces des dépendances en utilisant une certaine échelle numérique.

A. Niveau numérique

B. Niveau primaire

C. Niveau de dépendance

D. Niveau quantitatif

81: Apriori est un algorithme séminal pour décrocher des ensembles d'articles fréquents en utilisant:

A. Modèles de mélange normal

B. Génération des candidats

C. Méthodes de sur-ajustement

D. Aucun d'eux

82: Le protocole d'authentification utilisé par de nombreuses API Web significatifs est appelé:

A. Https

B. PGP

C. Oauth

D. SSL

83: Lequel de ceux-ci n'est pas une étape dans le processus KDD?

A. Intégration de données

B. Exploration de données

C. Nettoyage des données

D. Quantification des données

84: Laquelle des applications suivantes est généralement utilisée pour classer les étudiants & # 39; les performances?

A. L'analyse par grappes

B. Si ... alors ... Analyse

C. Analyse de régression

D. Analyse du marché du marché

85: Dans tout ensemble de données numériques avec une valeur moyenne significative, quelle est la fraction minimale des données qui se situeront dans N écart-type de la moyenne?

A. 1 / n ^ 2

B. 1 / N

C. 1-1 / n ^ 2

D. 1/2

86: Laquelle des méthodes suivantes peut être utilisée pour modéliser une variable cible catégorique?

A. Tout ce qui précède

B. Régression logistique

C. Arima

D. Régression non linéaire

E. Régression

87: Lequel des éléments suivants n'est pas une phase principale d'un réducteur Hadoop?

A. Trier

B. Réduire

C. Carte

D. Mélanger

88: Lequel de ceux-ci est une architecture possible d'un système d'exploration de données?

A. Sans couplage

B. Couplage magnétique

C. Couplage transitif

D. Couplage rapide

89: Vrai ou faux? Les réseaux de neurones artificiels sont des modèles prédictifs linéaires.

A. Vrai

B. FAUX

90: Les différences mesurées entre un modèle et ses prédictions sont connues:

A. Bruit

B. Aberrements

C. Gamme

D. Données non applicables

91: La technique basée sur le hachage, la réduction des transactions, la portionnement, l'échantillonnage et le comptage des éléments dynamiques sont tous des exemples de quoi?

A. Techniques pour améliorer l'efficacité d'un algorithme d'Apriri

B. Méthode pour scanner à plusieurs reprises la base de données et vérifier un grand ensemble de candidats par correspondance de motifs.

C. Méthodes pour générer des ensembles d'articles fréquents sans génération de candidats.

D. Méthodes pour trouver une description compacte pour un sous-ensemble de données.

92: Lequel des énoncés suivants fait partie d'une stratégie d'exploration de données des clients au détail?

A. Témoignages de clients

B. vente de vacances

C. garantie de remboursement

D. cartes de fidélité

93: Quelle méthode d'arbre de décision effectue des divisions à plusieurs niveaux lors du calcul des arbres de classification?

A. ID3 (itérative dichotomiser 3)

B. Algorithme C4.5

C. Chariot (arbres de classification et de régression)

D. Chaid (détection d'interaction automatique de Chi Square)

94: Quel est l'avantage de l'algorithme de clustering KEDOIDS K sur l'algorithme de clustering K-Means (Lloyd & # 39; s)?

A. utilise un raffinement itératif

B. plus résistant aux valeurs aberrantes

C. tout ce qui précède

D. représente les clusters par centre

95: Les deux fonctions principales des serveurs BI sont:

A. Traitement et gestion

B. Source et résultats

C. Gestion et livraison

D. Application et livraison

96: Lequel des éléments suivants n'est pas un outil approprié pour la récolte des données d'un site Web qui accède à sa base de données via des appels JavaScript / Ajax?

A. Tout ce qui précède est approprié

B. Sélénium

C. Fantômes

D. wget

97: Une approche descriptive pour explorer les données qui peuvent aider à identifier les relations entre les valeurs dans une base de données est:

A. Analyse prédictive

B. Activation de la fonction

C. Analyse des liens

D. Regroupement

98: Comment mesurez-vous l'intérêt dans les modèles d'association?

A. Mesure la variance

B. mesurer la pertinence

C. précision des mesures

D. Mesurez le lifting

99: Lequel des éléments suivants n'est pas valide JSON?

A. {& # 34; Réponse & # 34;: & # 34; Celui-ci & # 34;}

B. {& # 34; Réponse & # 34;: [& # 34; Celui-ci & # 34;]}

C. {[& # 34; Réponse & # 34;: & # 34; Celui-ci & # 34;]}

D. Tous sont valables

100: Où un opérateur de site Web peut-il généralement trouver des données sur ses clients & # 39; Adresses IP?

A. En-têtes de demande HTTP

B. biscuits

C. Fiaries de journaux de serveur

D. tout ce qui précède

List of Questions de Data Mini...

Available in:

Data Mining

Вопросы Сбор данных на русском языке

Preguntas de minería de datos en idiomas españoles

日本語でのデータマイニングの質問

Domande di Data Mining in lingua italiana

Questions de Data Mining en langues françaises

Questões de Data Mining em Língua Portuguesa

Data-Mining-Fragen in deutschen Sprachen

中文（简体）语言的数据挖掘问题

أسئلة التنقيب عن البيانات باللغات العربية

Soal Data Mining dalam bahasa Indonesia

Türkçe dillerinde Veri Madenciliği soruları

Latest MCQs:

Questions à Choix Multiples (MCQ) sur Amazon Web Services (AWS)

Questions à Choix Multiples (MCQ) sur SharePoint

Questions et réponses SQL MCQ

Questions et réponses PostgreSQL MCQ

Questions à choix multiples pour le Test Technique iOS

Popular MCQs:

Visual Basic 6 questions en langues françaises

Questions de programmation DB2 en langues françaises

ASP.NET avec des questions SQL Server en langues françaises

Twitter-Développement questions en langues françaises

Questions JDBC en langues françaises

Questions de Data Mining en langues françaises

Questions de Data Mining en langues françaises

1: Quelle industrie peut bénéficier de l'exploration de données?

2: Avec laquelle de ces couches un réseau neuronal commence-t-il?

3: Les modifications des parties d'un code pourraient entraîner le problème des données ______________.

4: Dans un filet neuronal, à quoi se référait la topologie?

5: Lequel des algorithmes de clustering suivants peut trouver des grappes de forme arbitraire?

6: Les arbres de décision sont capables de gérer les valeurs manquantes sans utiliser de transformation impute. Vrai ou faux?

7: Un algorithme (n) _____ crée des règles qui décrivent la fréquence à laquelle les événements se sont produits ensemble.

8: Lequel des éléments suivants est un XML valide?

9: Lequel des éléments suivants n'est pas une base de données relationnelle?

10: Qu'est-ce que la visualisation des données?

11: Qu'est-ce qu'un processus KDD?

12: Lesquels ne sont pas des types de logiciels analytiques:

13: Vrai ou faux? Les indicateurs économiques sont des facteurs de données externes.

14: Laquelle des disciplines suivantes chevauche l'exploration de données?

15: Dans les modèles prédictifs, les valeurs ou les classes à prédire sont appelées:

17: Les éléments de données regroupés en relations et préférences sont connues:

18: Que sont les arbres de décision?

19: Quelles sont les méthodes d'exploration de données populaires?

20: Vrai de faux? L'architecture d'exploration de données de couplage lâche est principalement pour les systèmes d'exploration de données basés sur la mémoire qui ne nécessitent pas d'évolutivité élevée et de performances élevées.

21: Qu'est-ce que Crisp-DM?

22: Une fonction utilisée par un nœud dans un filet neuronal pour transformer les données d'entrée de n'importe quel domaine de valeurs en une plage finie de valeurs est appelée (n):

23: Vrai ou faux? Les tests en panier sont toujours binaires.

24: Quelle est la mesure de la façon dont deux variables aléatoires changent ensemble?

25: Lequel de ceux-ci est un exemple d'une relation de modèle séquentielle?

27: Quelle est la couche frontale de l'architecture d'exploration de données?

28: Un hyperplan est un

29: Les données non collectées par l'organisation, telles que les données d'une base de données propriétaires, qui sont combinées avec les propres données de l'organisation est connue:

30: Lesquels ne sont pas considérés comme des facteurs de données internes?

31: Quelle technique d'exploration de données organise des ensembles de données en groupes prédéfinis?

32: Le niveau du modèle qui spécifie (souvent graphiquement) quelles variables dépendent localement les unes des autres.

33: Pour accroître la confiance de votre état de performance de classification sur l'ensemble de la population, vous devez:

34: L'algorithme alimentaire le moteur de recherche Google est:

35: Dans l'association entre deux variables, quelle est la différence entre l'antécédent et la conséquence?

36: Dans l'analyse des données des séries chronologiques, la valeur moyenne sur une période de temps donnée (généralement un intervalle dans le passé jusqu'à présent) est appelée (n)

37: Qu'est-ce que la régression?

38: Qu'est-ce que la modélisation des dépendances?

39: Laquelle de celles-ci n'est pas une descriptions communes des couches?

40: Le Sharding fait référence à:

41: Qu'est-ce que la détection du changement et de la déviation?

42: Quel est le type d'exploration de données qui pilote le système de recommandation Amazon.com?

43: Lequel des algorithmes suivants convient généralement aux tâches d'apprentissage non supervisées?

44: Laquelle des solutions de stockage suivantes est la plus appropriée pour un ensemble de données semi-structuré dont les membres n'ont pas tous les mêmes attributs?

45: Afin d'estimer les performances de classification sur une population entière, vous avez besoin de _______

46: L'erreur de généralisation est une conséquence de

47: Lesquelles de ces méthodes de calcul évolutives?

48: Les machines vectorielles de support ont un avantage sur les réseaux de neurones car SVM & # 39; s sont

49: Lequel des éléments suivants n'est pas un système source commun?

50: Une technique qui classe chaque enregistrement dans un ensemble de données basé sur une combinaison des classes du ou des enregistrements K le plus similaire dans un ensemble de données historique est:

51: Quelle est l'extraction de règles si utiles, alors des données basées sur la signification statistique?

52: Qu'est-ce que la classification?

53: Lequel des éléments suivants n'est pas fonction des entrepôts de données?

54: Vrai ou faux? L'algorithme Mars ne peut pas produire de règles.

55: Lequel des éléments suivants est le plus approprié pour trouver la chaîne d'amis la plus courte reliant deux personnes dans un graphique social qui ne sont pas des amis les uns avec les autres?

56: Lequel des éléments suivants n'est pas un objectif commun du processus KDD:

57: Qu'est-ce qu'un algorithme génétique?

58: Qu'est-ce que l'intérêt?

59: Dans le modèle MapReduce, la carte et la réduction des fonctions agissent directement sur quel type de structure de données?

60: Dans le traitement du langage naturel, quel est le rôle d'un analyseur lexical?

61: Qu'est-ce que le regroupement?

62: Un SGBD réduit la redondance des données et l'incohérence par

63: Dans quel type d'analyse une carte de fonctionnalité Kohonen est-elle généralement utilisée?

64: Lequel des algorithmes de clustering FollownG peut optimiser une fonction OJBective?

65: Les informations converties pour fournir des informations sur les modèles historiques et les tendances futures sont connues:

66: Laquelle des propriétés suivantes s'applique aux perceptrons à couche unique?

67: Lequel des éléments suivants n'est pas une méthode de combinaison de plusieurs modèles en un modèle d'ensemble?

68: Qu'est-ce que le résumé?

69: & # 34; dans 2% des achats de la quincaillerie, un choix et une pelle ont été achetés », est un exemple de:

70: Une alternative continue couramment utilisée à la fonction de pas dans la sortie du réseau neuronal multicouche est la

71: Qu'est-ce que le cochon

72: Prendre plusieurs échantillons aléatoires de données et construire un modèle de classification pour chacun est connu comme:

73: Quelle expression de sélecteur xpath capture tous les éléments de liaison du formulaire & # 39; http: //example.com/profile/12345' Dans une page HTML tout en excluant tous les liens du formulaire & # 39; http: //example.com/casenumber/12345?

74: Lequel des algorithmes suivants produit des arbres de décision?

75: Laquelle des propriétés suivantes est une contrainte sur une demande RESTful?

76: Le composant du système de fichiers distribué Hadoop responsable du stockage des métadonnées est appelé le

77: Si plusieurs valeurs se produisent le même nombre de fois, les données sont:

78: Quelle est la première étape de la phase de compréhension des entreprises?

79: Qu'est-ce que Curl?

80: Le niveau du modèle qui spécifie les forces des dépendances en utilisant une certaine échelle numérique.