Ces questions et réponses à choix multiples sur l'exploration de données vous aideront à mieux comprendre les sujets d'exploration de données. Préparez-vous pour votre prochain examen ou entretien avec ces plus de 100 collections de données QCM.
Faites défiler vers le bas pour commencer à répondre.
A. Tous ces
B. Détail
C. Fabrication
D. Finance / banque
A. Couche de sortie
B. Couche cachée
C. Couche transparente
D. Couche d'entrée
A. inconsistant
B. sale
C. non intégré
D. granulaire
A. La gamme de variables dans un ensemble
B. Le nombre de nœuds utilisés
C. La visualisation graphique des données
D. Le nombre de couches et le nombre de nœuds dans chaque couche
A. Liaison unique
B. Dsbscan
C. Ces deux
D. Aucun d'eux
A. FAUX
B. Vrai
A. Chaid
B. artificiel
C. taille
D. associatif
A. & lt; Body Answer = & # 34; valide & # 34; & gt; celui-ci & lt; / body & gt;
B. & lt; valide & gt; celui-ci & lt; / valide & gt;
C. & lt; valid & gt; & # 34; celui-ci & # 34; & lt; / valid & gt;
D. Tous sont valides
A. Tout ce qui précède
B. Apache Cassandra
C. Big Table Google
D. Mongodb
A. Le terme technique pour l'acte de données stocké dans un serveur
B. Une prédiction structurée et développée des résultats des données
C. L'interprétation visuelle des relations complexes dans les données multidimensionnelles
A. Décryptage différentiel
B. Knoop-hardness mesuré par une dimension à fort impact
C. Découverte de connaissances dans les bases de données
D. K-Mean Data Discovery
A. Tous sont des types valides
B. Réseau neuronal
C. Statistique
D. Apprentissage automatique
A. FAUX
B. Vrai
A. Tout ce qui précède
B. Intelligence artificielle
C. Statistiques
D. Linguistique
A. Dépendant
B. Tous ces
C. Réponse
D. Variables cibles
A. Classification
B. Régression
C. Segmentation
A. Ensembles prévisibles
B. Organisations passantes
C. Degrés d'ajustement
D. Groupes
A. Des rapports complexes générés par un data scientifique qualifié
B. Dimensions hiérarchiques qui peuvent être créées avec un navigateur Hyper Cube
C. Données non collectées par l'organisation, telles que les données disponibles à partir d'un livre de référence
D. Structures qui génèrent des règles pour la classification d'un ensemble de données
A. Modèles d'apprentissage relationnel
B. Arbres et règles de décision
C. Tous ces
D. Modèles de dépendance graphique probabiliste
A. FAUX
B. Vrai
A. Un arbre de décision développé dans les années 1980 mais presque entièrement remplacés par la méthode CART aujourd'hui
B. Une méthode en six phases pour prédire les habitudes d'achat du commerce électronique
C. Algorithme de régression linéaire de Microsoft
D. Un processus standard de l'industrie croisée pour l'exploration de données
A. Antécédent
B. Fonction d'activation
C. Matrice de confusion
D. Chi carré
A. Vrai
B. FAUX
A. écart-type binaire
B. Covariance
C. polyconvergence
D. inertie stochastique
A. Utilisation de l'expérience commerciale et de l'intestint pour concevoir un nouveau plan d'étage dans une épicerie
B. Réorganisation de votre équipe de départ de votre équipe de basket-ball basée sur une analyse des performances
C. Placer deux articles fréquemment achetés l'un à côté de l'autre sur l'étagère
D. Prédire la probabilité qu'un sac à dos soit acheté en fonction d'un achat de consommateur de sacs de couchage et de chaussures de randonnée
A. Segmentation
B. Classification
C. Régression
A. Une interface utilisateur intuitive et conviviale
B. Pare-feu établis pour protéger les données contre des sources malveillantes
C. Le matériel conçu spécifiquement pour le stockage de quantités massives de données
D. L'équipe de programmeurs qui ont conçu le logiciel utilisé dans un projet minier particulier
A. Décision Limite séparant les classes de données
B. variante de l'algorithme C4.5
C. Collection de fichiers hypertextes liés
D. condition d'erreur non terminante
A. Superposition
B. Sur-ajustement
C. Bruit
D. Date non applicable
A. Prix
B. Ralentissement économique
C. Compétences du personnel
D. Positionnement de produit
A. Strouille séquentielle
B. Regroupement
C. Classification
D. Gamification
A. Niveau structurel
B. Niveau qualitatif
C. Niveau primaire
D. Niveau quantitatif
A. Diminuer la taille de l'ensemble de données de formation
B. Augmenter la taille de l'ensemble de données de formation
C. Augmentez la taille de l'ensemble de données de test
D. Diminuer la taille de l'ensemble de données de test
A. Adaboost
B. La méthode de la pages brin
C. Googlecrawler
D. Classement
A. L'anticédent est toujours une variable très complexe
B. Rien, ils sont interchangeables
C. L'antécédent est à droite, la conséquente est à gauche.
D. L'antécédent est à gauche, le conséquent à droite
A. moyenne partielle
B. moyenne impartiale
C. moyenne composée
D. moyenne mobile
A. Apprendre une fonction qui mappe un élément de données dans l'un des nombreux groupes prédéfinis.
B. Une expression e dans une langue l décrivant les faits dans un sous-ensemble Fe de F.
C. Une tâche descriptive où l'on cherche à identifier un ensemble fini de catégories pour décrire les données.
D. Apprendre une fonction qui mappe un élément de données à une variable de prédiction à valeur réelle.
A. Un processus en plusieurs étapes impliquant la préparation des données, la recherche de modèles, l'évaluation des connaissances et le raffinement avec itération après modification.
B. Apprendre une fonction qui mappe un élément de données dans l'un des nombreux groupes ou clusters prédéfinis.
C. Le processus de recherche d'un modèle qui décrit des dépendances significatives entre les variables
D. Une tâche qui se compose de techniques d'estimation, à partir des données, la fonction conjointe de densité de probabilité multi-variées de toutes les variables / champs de la base de données.
A. Caché
B. Saisir
C. Sortir
D. Fonctionnel
A. Une mesure du bruit dans une base de données du contenu
B. partition d'une base de données pour la distribution sur différents serveurs
C. Accédant simultanément à plusieurs bases de données d'objets sur SSH
D. Aucune de ces réponses
A. Une tâche axée sur la découverte des changements les plus significatifs dans les données des valeurs précédemment mesurées ou normatives
B. Méthodes pour trouver une description compacte pour un sous-ensemble de données.
C. Le processus de recherche d'un modèle qui décrit des dépendances significatives entre les variables
D. Une tâche qui se compose de techniques d'estimation, à partir des données, la fonction conjointe de densité de probabilité multi-variées de toutes les variables / champs de la base de données.
A. Logique floue
B. Association Apprentissage
C. Détection d'une anomalie
D. Algorithmes de regroupement
A. Machine Boltzmann restreinte
B. Réseaux d'info-Fuzzy
C. voisin k-nearest
D. K-means algorithme
A. MongoDB
B. Sqlite
C. Mysql
D. Mariadb
A. (Aucun d'eux)
B. Formation disjointe
C. Ensembles de données de test
D. Ensembles de données de formation et de test disjoints
A. Surfit
B. Analyse paramétrique
C. Sous-forme
D. Chernoff lié à Cheroff mal défini
A. Algorithmes heuristiques
B. Algorithmes d'inférence bayésienne
C. Algorithmes génétiques
D. Algorithmes de regroupement
A. Aucune de ces réponses
B. plus facile à s'entraîner via l'apprentissage en ligne
C. plus résistant aux minima locaux de convergence
D. paramétrique
A. Nœud
B. Source SAP
C. UDC
D. DB Connect
A. Voisin le plus proche
B. Régression logistique
C. Requête du modèle d'association
D. Arbre de décision
A. Mappage de méthode préliminaire
B. Induction de règle
C. Application logique floue
D. Inférence d'informations dynamiques
A. Méthodes pour trouver une description compacte pour un sous-ensemble de données.
B. Apprendre une fonction qui mappe un élément de données dans l'un des nombreux groupes prédéfinis.
C. Un modèle découvert qui est vrai sur de nouvelles données avec un certain degré de certitude et se généralise à d'autres données.
D. Une tâche descriptive où l'on cherche à identifier un ensemble fini de catégories pour décrire les données.
A. Nettoyage des données sales
B. Extraction de données
C. Données de nettoyage
D. Stockage des données achetées
A. Vrai
B. FAUX
A. algorithme de k-means
B. Chaînes de Markov
C. Algorithme de Dijkstra
D. Les réseaux de neurones
A. Description
B. Performance
C. Prédiction
A. Un algorithme de recherche qui nous permet de localiser une chaîne binaire optimale en traitant une population aléatoire initiale de chaînes binaires en effectuant des opérations telles que la mutation artificielle, le croisement et la sélection.
B. Un algorithme qui estime à quel point un modèle particulier (un modèle et ses paramètres) répond aux critères du processus KDD. L'évaluation de la précision prédictive (validité) est basée sur la validation croisée. L'évaluation de la qualité descriptive implique un prédictif
C. Un algorithme classique pour l'exploration de règles des éléments fréquents et l'apprentissage des règles d'association sur les bases de données transactionnelles. Il procède en identifiant les éléments individuels fréquents dans la base de données et en les étendant à des ensembles d'articles de plus en plus grands tant que ces éléments S
A. Une mesure globale de la valeur du modèle, combinant la validité, la nouveauté, l'utilité et la simplicité.
B. Une expression e dans une langue l décrivant les faits dans un sous-ensemble Fe de F.
C. Un processus en plusieurs étapes impliquant la préparation des données, la recherche de modèles, l'évaluation des connaissances et le raffinement avec itération après modification.
D. Un modèle découvert qui est vrai sur de nouvelles données avec un certain degré de certitude et se généralise à d'autres données.
A. Matrices MySQL
B. listes liées
C. bases de données relationnelles
D. paire de valeurs clés
A. vérifie la validité d'un jeton
B. divise le flux de caractères d'entrée dans les jetons
C. génère une grammaire sans contexte
D. traite l'arbre d'analyse pour le sens sémantique
A. Une tâche qui se compose de techniques d'estimation, à partir des données, la fonction conjointe de densité de probabilité multi-variées de toutes les variables / champs de la base de données.
B. Une tâche descriptive où l'on cherche à identifier un ensemble fini de catégories pour décrire les données.
C. Apprendre une fonction qui mappe un élément de données dans l'un des nombreux groupes ou clusters prédéfinis.
D. Le processus de recherche d'un modèle qui décrit des dépendances significatives entre les variables
A. Utilisation d'un dictionnaire de données
B. Programme et données de découplage
C. Minimiser les fichiers isolés avec des données répétées
D. Appliquer l'intégrité référentielle
A. Analyse de modélisation descriptive
B. L'analyse par grappes
C. L'analyse exploratoire des données
D. Analyse prédictive
A. Régression linéaire
B. Regroupement
C. Connaissance
D. Métadonnées
A. étalon
B. Insulalisation aléatoire des poids
C. sortie continue
D. capable d'apprendre des séparations non linéaires
A. Vote
B. Empilement
C. Moyenne
D. Bootstrap
A. Une tâche axée sur la découverte des changements les plus significatifs dans les données des valeurs précédemment mesurées ou normatives
B. Une tâche descriptive où l'on cherche à identifier un ensemble fini de catégories pour décrire les données.
C. Le processus de recherche d'un modèle qui décrit des dépendances significatives entre les variables
D. Méthodes pour trouver une description compacte pour un sous-ensemble de données.
A. Validation
B. Soutien
C. Enseignement supervisé
D. Topologie
A. Fonction logistique
B. NN multicouche ne peut pas calculer la sortie continue
C. fonction hyperbolique
D. fonction logarithmique
A. Un langage de programmation qui permet à Hadoop de fonctionner comme un entrepôt de données.
B. Aucun d'eux
C. Un langage de programmation qui simplifie les tâches courantes de travail avec Hadoop.
A. Échantillon flou
B. Rabattement
C. Boosting
D. Regroupement
A. // a / [contient (@href, & # 34; profil & # 34;)]
B. // a / [contient (@href, & # 34; profil & # 34;)] / @ href
C. // href / profil
D. // a / profil
A. Dbscan
B. ID3
C. Aucune de ces réponses
D. régression logistique
A. sans état
B. Sépréteur linéairement
C. Renvoie la sortie JSON
D. avec état
A. Code de données
B. Shell FS
C. Dfsadmin
D. Namenode
A. À multiples facettes
B. À plusieurs feuilles
C. Multivarié
D. Multi-modal
A. Saisissez fermement les objectifs et les besoins de l'entreprise
B. Évaluez la situation actuelle en découvrant les ressources, les hypothèses, les contraintes, etc.
C. Créer des objectifs d'exploration de données pour atteindre les objectifs commerciaux
D. Créez une liste de tous les algorithmes pertinents à appliquer à la tâche
A. Un outil de ligne de commande pour récupérer les fichiers
B. Une méthodologie pour classer les caractéristiques cachées des données
C. La partie de HTTP qui spécifie l'autorisation d'accès
D. Algorithme combinatoire d'apprentissage récursif non supervisé
A. Niveau numérique
B. Niveau primaire
C. Niveau de dépendance
D. Niveau quantitatif
A. Modèles de mélange normal
B. Génération des candidats
C. Méthodes de sur-ajustement
D. Aucun d'eux
A. Https
B. PGP
C. Oauth
D. SSL
A. Intégration de données
B. Exploration de données
C. Nettoyage des données
D. Quantification des données
A. L'analyse par grappes
B. Si ... alors ... Analyse
C. Analyse de régression
D. Analyse du marché du marché
A. 1 / n ^ 2
B. 1 / N
C. 1-1 / n ^ 2
D. 1/2
A. Tout ce qui précède
B. Régression logistique
C. Arima
D. Régression non linéaire
E. Régression
A. Trier
B. Réduire
C. Carte
D. Mélanger
A. Sans couplage
B. Couplage magnétique
C. Couplage transitif
D. Couplage rapide
A. Vrai
B. FAUX
A. Bruit
B. Aberrements
C. Gamme
D. Données non applicables
A. Techniques pour améliorer l'efficacité d'un algorithme d'Apriri
B. Méthode pour scanner à plusieurs reprises la base de données et vérifier un grand ensemble de candidats par correspondance de motifs.
C. Méthodes pour générer des ensembles d'articles fréquents sans génération de candidats.
D. Méthodes pour trouver une description compacte pour un sous-ensemble de données.
A. Témoignages de clients
B. vente de vacances
C. garantie de remboursement
D. cartes de fidélité
A. ID3 (itérative dichotomiser 3)
B. Algorithme C4.5
C. Chariot (arbres de classification et de régression)
D. Chaid (détection d'interaction automatique de Chi Square)
A. utilise un raffinement itératif
B. plus résistant aux valeurs aberrantes
C. tout ce qui précède
D. représente les clusters par centre
A. Traitement et gestion
B. Source et résultats
C. Gestion et livraison
D. Application et livraison
A. Tout ce qui précède est approprié
B. Sélénium
C. Fantômes
D. wget
A. Analyse prédictive
B. Activation de la fonction
C. Analyse des liens
D. Regroupement
A. Mesure la variance
B. mesurer la pertinence
C. précision des mesures
D. Mesurez le lifting
A. {& # 34; Réponse & # 34;: & # 34; Celui-ci & # 34;}
B. {& # 34; Réponse & # 34;: [& # 34; Celui-ci & # 34;]}
C. {[& # 34; Réponse & # 34;: & # 34; Celui-ci & # 34;]}
D. Tous sont valables
A. En-têtes de demande HTTP
B. biscuits
C. Fiaries de journaux de serveur
D. tout ce qui précède