Queste domande e risposte a scelta multipla sul data mining ti aiuteranno a comprendere meglio gli argomenti del data mining. Preparati per il tuo prossimo esame o colloquio con queste oltre 100 raccolte di dati MCQ.
Scorri verso il basso per iniziare a rispondere.
A. Tutti questi
B. Vedere al dettaglio
C. Produzione
D. Finanza/banca
A. Livello di output
B. Strato nascosto
C. Strato trasparente
D. Livello di input
A. incoerente
B. sporco
C. non integrato
D. granulare
A. La gamma di variabili in un set
B. Il numero di nodi utilizzati
C. La visualizzazione grafica dei dati
D. Il numero di livelli e il numero di nodi in ogni livello
A. Single-link
B. Dsbscan
C. Entrambi
D. Nessuna di queste
A. Falso
B. VERO
A. Chaid
B. artificiale
C. potatura
D. associativo
A. & lt; Body Risponde = " valid " & gt; questo & lt;/body & gt;
B. & lt; valid & gt; questo & lt;/valid & gt;
C. & lt; valid & gt; " questo " & lt;/valid & gt;
D. Tutti sono validi
A. Tutti i precedenti
B. Apache Cassandra
C. Google Big Table
D. MongodB
A. Il termine tecnico per l'atto dei dati memorizzati in un server
B. Una previsione strutturata e sviluppata dei risultati dei dati
C. L'interpretazione visiva di relazioni complesse nei dati multidimensionali
A. Decrittazione differenziale
B. HOOP-HERDENZE Misurata attraverso una dimensione ad alto impatto
C. Discovery della conoscenza nei database
D. Discovery di dati K-mean
A. Tutti sono tipi validi
B. Rete neurale
C. Statistico
D. Apprendimento automatico
A. Falso
B. VERO
A. Tutti i precedenti
B. Intelligenza artificiale
C. Statistiche
D. Linguistica
A. Dipendente
B. Tutti questi
C. Risposta
D. Variabili target
A. Classificazione
B. Regressione
C. Segmentazione
A. Set prevedibili
B. Organizzazioni punzionali
C. Gradi di adattamento
D. Cluster
A. Rapporti complessi generati da uno scienziato dati qualificato
B. Dimensioni gerarchiche che possono essere create con un browser Hyper Cube
C. Dati non raccolti dall'organizzazione, come i dati disponibili da un libro di consultazione
D. Strutture che generano regole per la classificazione di un set di dati
A. Modelli di apprendimento relazionale
B. Alberi e regole decisionali
C. Tutti questi
D. Modelli di dipendenza grafica probabilistica
A. Falso
B. VERO
A. Un albero decisionale sviluppato nel 1980 e#039; ma quasi interamente sostituito con il metodo CART oggi
B. Un metodo a sei fasi per prevedere le abitudini di acquisto del commercio elettronico
C. Algoritmo di regressione lineare di Microsoft
D. Un processo standard incrociato per il data mining
A. Antecedente
B. Funzione di attivazione
C. Matrix di confusione
D. Chi-quadrato
A. VERO
B. Falso
A. Deviazione standard binaria
B. covarianza
C. Polyconvergence
D. inerzia stocastica
A. Utilizzo dell'esperienza commerciale e istinto per progettare un nuovo piano in un negozio di alimentari
B. Riorganizzare la formazione di partenza della tua squadra di basket basata su un'analisi delle prestazioni
C. Posizionando due articoli acquistati frequentemente uno accanto all'altro sullo scaffale
D. Prevedere la probabilità che uno zaino sia acquistato in base a un acquisto di sacchi a pelo e scarpe da trekking
A. Segmentazione
B. Classificazione
C. Regressione
A. Un'interfaccia utente intuitiva e facile da usare
B. Firewall stabiliti per proteggere i dati da fonti dannose
C. L'hardware progettato specificamente per l'archiviazione di enormi quantità di dati
D. Il team di programmatori che ha progettato il software utilizzato in un particolare progetto di mining
A. DECCIBILE CONFINE ASSEGNAZIONE CLASSE DI DATI
B. Variante dell'algoritmo C4.5
C. Raccolta di file ipertestuali collegati
D. Condizione di errore non terminale
A. Overlay
B. Eccessivo
C. Rumore
D. Data non applicabile
A. Prezzo
B. Recessioni economiche
C. Competenze del personale
D. Posizionamento del prodotto
A. Pattern sequenziale
B. Clustering
C. Classificazione
D. Gamification
A. Livello strutturale
B. Livello qualitativo
C. Livello primario
D. Livello quantitativo
A. Diminuire le dimensioni del set di dati di allenamento
B. Aumenta le dimensioni del set di dati di formazione
C. Aumenta le dimensioni del set di dati di test
D. Diminuire le dimensioni del set di dati di test
A. Adaboost
B. Il metodo brin-page
C. Googlecrawler
D. PageRank
A. L'antecedente è sempre una variabile molto complessa
B. Niente, sono intercambiabili
C. L'antecedente è sulla destra, il conseguente è a sinistra.
D. L'antecedente è a sinistra, il conseguente a destra
A. media parziale
B. Media imparziale
C. Medio composto
D. media mobile
A. Apprendimento di una funzione che mappa un elemento di dati in uno dei numerosi gruppi predefiniti.
B. Un'espressione e in una lingua L che descrive i fatti in un sottoinsieme Fe di F.
C. Un'attività descrittiva in cui si cerca di identificare un insieme finito di categorie per descrivere i dati.
D. Apprendimento di una funzione che mappa un elemento di dati a una variabile di previsione con valori reali.
A. Un processo in più fasi che coinvolge la preparazione dei dati, la ricerca di pattern, la valutazione delle conoscenze e il perfezionamento con iterazione dopo la modifica.
B. Apprendimento di una funzione che mappa un elemento di dati in uno dei numerosi gruppi o cluster predefiniti.
C. Il processo di ricerca di un modello che descriva dipendenze significative tra variabili
D. Un compito che consiste in tecniche per la stima, dai dati, la funzione di densità di probabilità multi-variata articolare di tutte le variabili/campi nel database.
A. Nascosto
B. Ingresso
C. Produzione
D. Funzionale
A. una misura del rumore in un contenuto di database
B. Partipo di un database per la distribuzione su server diversi
C. Accesso contemporaneamente a più database di oggetti su SSH
D. nessuna delle precedenti
A. Un compito incentrato sulla scoperta delle modifiche più significative nei dati da valori precedentemente misurati o normativi
B. Metodi per trovare una descrizione compatta per un sottoinsieme di dati.
C. Il processo di ricerca di un modello che descriva dipendenze significative tra variabili
D. Un compito che consiste in tecniche per la stima, dai dati, la funzione di densità di probabilità multi-variata articolare di tutte le variabili/campi nel database.
A. Logica fuzzy
B. Associazione Apprendimento
C. Rilevamento di anomalie
D. Algoritmi di clustering
A. Macchina Boltzmann limitata
B. reti info-fuzzy
C. vicino più vicino
D. Algoritmo K-Means
A. MongoDB
B. Sqlite
C. Mysql
D. Mariadb
A. (Nessuna di queste)
B. Allenamento disgiunta
C. Set di dati di prova
D. set di dati di allenamento e test disgiunti
A. Overfit
B. Analisi parametrica
C. Underfit
D. Chernoff scarsamente definito
A. Algoritmi euristici
B. Algoritmi di inferenza bayesiana
C. Algoritmi genetici
D. Algoritmi di clustering
A. nessuna delle precedenti
B. più facile da allenarsi tramite apprendimento online
C. più resistente alla convergenza dei minimi locali
D. parametrico
A. Nodo
B. Fonte SAP
C. UDC
D. DB Connect
A. Il vicino più prossimo
B. Regressione logistica
C. Query modello di associazione
D. Tree decisionali
A. Mappatura preliminare del metodo
B. Induzione della regola
C. Applicazione logica fuzzy
D. Inferenza delle informazioni dinamiche
A. Metodi per trovare una descrizione compatta per un sottoinsieme di dati.
B. Apprendimento di una funzione che mappa un elemento di dati in uno dei numerosi gruppi predefiniti.
C. Un modello scoperto che è vero su nuovi dati con un certo grado di certezza e si generalizza ad altri dati.
D. Un'attività descrittiva in cui si cerca di identificare un insieme finito di categorie per descrivere i dati.
A. Pulizia di dati sporchi
B. Estrazione di dati
C. Dati di pulizia
D. Archiviazione dati acquistati
A. VERO
B. Falso
A. Algoritmo K-Means
B. Catene di Markov
C. Dijkstra ' s Algorithm
D. Reti neurali
A. Descrizione
B. Prestazione
C. Predizione
A. Un algoritmo di ricerca che ci consente di individuare una stringa binaria ottimale elaborando una popolazione casuale iniziale di stringhe binarie eseguendo operazioni come mutazione artificiale, crossover e selezione.
B. Un algoritmo che stima quanto un particolare modello (un modello e i suoi parametri) soddisfi i criteri del processo KDD. La valutazione dell'accuratezza predittiva (validità) si basa sulla convalida incrociata. La valutazione della qualità descrittiva comporta predittiva a
C. Un algoritmo classico per gli articoli frequenti set di minerario e l'apprendimento delle regole di associazione su database transazionali. Procede identificando i singoli elementi frequenti nel database e estendendoli a set di articoli sempre più grandi fintanto che quegli elementi s
A. Una misura generale del valore del modello, combinando validità, novità, utilità e semplicità.
B. Un'espressione e in una lingua L che descrive i fatti in un sottoinsieme Fe di F.
C. Un processo in più fasi che coinvolge la preparazione dei dati, la ricerca di pattern, la valutazione delle conoscenze e il perfezionamento con iterazione dopo la modifica.
D. Un modello scoperto che è vero su nuovi dati con un certo grado di certezza e si generalizza ad altri dati.
A. Matrici mysql
B. elenchi collegati
C. Database relazionali
D. coppia di valore chiave
A. Controlla la validità di un token
B. divide il flusso di caratteri input in token
C. Genera una grammatica senza contesto
D. elabora l'albero di analisi per il significato semantico
A. Un compito che consiste in tecniche per la stima, dai dati, la funzione di densità di probabilità multi-variata articolare di tutte le variabili/campi nel database.
B. Un'attività descrittiva in cui si cerca di identificare un insieme finito di categorie per descrivere i dati.
C. Apprendimento di una funzione che mappa un elemento di dati in uno dei numerosi gruppi o cluster predefiniti.
D. Il processo di ricerca di un modello che descriva dipendenze significative tra variabili
A. Utilizzo di un dizionario di dati
B. Programma e dati di disaccoppiamento
C. Minimizzare i file isolati con dati ripetuti
D. Applicare l'integrità referenziale
A. Analisi di modellazione descrittiva
B. Analisi di gruppo
C. Analisi dei dati esplorativi
D. Analisi predittiva
A. Regressione lineare
B. Clustering
C. Conoscenza
D. Meta-Data
A. backpropagation
B. Initalizzazione casuale dei pesi
C. output continuo
D. in grado di imparare separazioni non lineari
A. Voto
B. Impilamento
C. Media
D. Bootstrap
A. Un compito incentrato sulla scoperta delle modifiche più significative nei dati da valori precedentemente misurati o normativi
B. Un'attività descrittiva in cui si cerca di identificare un insieme finito di categorie per descrivere i dati.
C. Il processo di ricerca di un modello che descriva dipendenze significative tra variabili
D. Metodi per trovare una descrizione compatta per un sottoinsieme di dati.
A. Convalida
B. Supporto
C. Apprendimento supervisionato
D. Topologia
A. funzione logistica
B. NN a più strati non può calcolare l'output continuo
C. funzione iperbolica
D. funzione logaritmica
A. Un linguaggio di programmazione che consente a Hadoop di operare come data warehouse.
B. Nessuna di queste
C. Un linguaggio di programmazione che semplifica i compiti comuni di lavorare con Hadoop.
A. Campionamento fuzzy
B. Binning
C. Potenziamento
D. Clustering
A. // a/[contiene (@href, " profilo ")]
B. // a/[contiene (@href, " profilo ")]/@href
C. // href/profilo
D. // A/profilo
A. Dbscan
B. Id3
C. nessuna delle precedenti
D. regressione logistica
A. apolide
B. linearmente separabile
C. Restituisce l'output JSON
D. statale
A. DataNode
B. FS Shell
C. Dfsadmin
D. Namenode
A. Multifonte
B. Multi-Leauded
C. Multivariato
D. multi-modale
A. Afferrare fermamente obiettivi e bisogni di business
B. Valuta la situazione attuale scoprendo risorse, ipotesi, vincoli ecc.
C. Crea obiettivi di data mining per raggiungere gli obiettivi aziendali
D. Crea un elenco di tutti gli algoritmi pertinenti da applicare all'attività
A. Uno strumento di comando per il recupero di file
B. Una metodologia per classificare le caratteristiche nascoste dei dati
C. La parte di HTTP che specifica l'autorizzazione dell'accesso
D. Algoritmo di apprendimento ricorsivo non supervisionato combinatorio
A. Livello numerico
B. Livello primario
C. Livello di dipendenza
D. Livello quantitativo
A. Modelli di miscela normali
B. Generazione candidata
C. Metodi eccessiva
D. Nessuna di queste
A. Https
B. PGP
C. Oauth
D. SSL
A. Integrazione dei dati
B. Estrazione dei dati
C. Pulizia dei dati
D. Quantificazione dei dati
A. Analisi di gruppo
B. Se ... allora ... analisi
C. Analisi di regressione
D. Analisi del Basket di mercato
A. 1/n^2
B. 1/n
C. 1-1/n^2
D. 1/2n
A. Tutti i precedenti
B. Regressione logistica
C. Arima
D. Regressione non lineare
E. Regressione
A. Ordinare
B. Ridurre
C. Carta geografica
D. Shuffle
A. No-accoppiamento
B. Accoppiamento magnetico
C. Accoppiamento transitivo
D. Accoppiamento QuickStart
A. VERO
B. Falso
A. Rumore
B. Autoconti
C. Allineare
D. Dati non applicabili
A. Tecniche per migliorare l'efficienza di un algoritmo Apriori
B. Metodo per scansionare ripetutamente la scansione del database e controllare un ampio set di candidati mediante corrispondenza.
C. Metodi per generare set di articoli frequenti senza generazione di candidati.
D. Metodi per trovare una descrizione compatta per un sottoinsieme di dati.
A. Testimonianze dei clienti
B. Vendita per le vacanze
C. soddisfatti o rimborsati
D. carte fedeltà
A. ID3 (dicotomiser iterativo 3)
B. Algoritmo C4.5
C. CART (Classificazione e Regression Trees)
D. Chaid (Chi rilevatura di interazione automatica Chi Square)
A. Utilizza la raffinatezza iterativa
B. più resistente ai valori anomali
C. tutti i precedenti
D. rappresenta i cluster per centro
A. Elaborazione e gestione
B. Fonte e risultati
C. Gestione e consegna
D. Domanda e consegna
A. Tutto quanto sopra è appropriato
B. Selenio
C. Phantomjs
D. wget
A. Analisi predittiva
B. Attivazione della funzione
C. Analisi del collegamento
D. Clustering
A. misurare la varianza
B. misurare la pertinenza
C. Precisione di Meaure
D. Misura il sollevamento
A. {" risposta ": " questo "}
B. {" Risposta ": [" questo "]}
C. {[" Risposta ": " questo "]}
D. Tutti sono validi
A. HTTP Richiedi intestazioni
B. biscotti
C. Server Logfile
D. tutti i precedenti