Metti alla prova la tua comprensione degli argomenti di analisi dei dati rispondendo a oltre 100 MCQ di analisi dei dati.
Scorri verso il basso per iniziare!
A. Analisi esplicativa
B. Analisi spettrale
C. Previsione
D. Analisi descrittiva
A. Design del catalogo
B. Analisi dei dati del paniere
C. Marketing incrociato
D. Analisi del leader perdita
E. Tutti i precedenti
F. Nessuna delle precedenti
A. Può elaborare automaticamente messaggi ed e -mail.
B. Può indagare sui concorrenti strisciando i loro siti Web.
C. Può analizzare le risposte al sondaggio aperto.
D. Può analizzare la garanzia o i reclami assicurativi.
E. Tutti i precedenti.
A. Neurone di ingresso
B. Neurone nascosto
C. Neurone di output
D. Nessuna delle precedenti
A. Viene utilizzato per calcolare la probabilità condizionale tra ingresso e colonne prevedibili e presuppone che le colonne siano indipendenti.
B. Viene utilizzato per l'esecuzione della selezione automatica delle caratteristiche per limitare il numero di valori che vengono considerati durante la costruzione di un modello.
C. È fornito da Microsoft SQL Server Analysis Services per l'uso nella modellazione predittiva.
D. Viene utilizzato per considerare ogni coppia di valori di attributo di input e valori degli attributi di output.
E. Tutti i precedenti.
A. È usato per incoraggiare l'effetto di gruppo in caso di variabili altamente correlate.
B. Viene utilizzato per trovare la probabilità di event = successo e event = fallimento.
C. Viene utilizzato per l'aggiunta e la rimozione dei predittori secondo necessità per ogni passaggio.
D. È usato per penalizzare la dimensione assoluta dei coefficienti di regressione.
A. È usato per prevedere una o più variabili numeriche continue; Per esempio. profitto o perdita che si basa su altri attributi in un set di dati.
B. Viene utilizzato per trovare correlazioni tra diversi attributi in un set di dati.
C. Viene utilizzato per dividere i dati in gruppi o cluster di elementi che hanno proprietà simili.
D. Viene utilizzato per riassumere sequenze o episodi frequenti nei dati; Per esempio. Una serie di eventi di registro che precedono la manutenzione della macchina.
A. Ltemset
B. Rete di dipendenza
C. Regole
D. Nessuna delle precedenti
A. È usato per indicare se un evento può portare a una modifica in una serie temporale.
B. Viene utilizzato per indicare una tendenza o un modello in una serie temporale attraverso l'uso di grafici o altri strumenti.
C. Viene ampiamente utilizzato nel budget. che si basa su tendenze storiche.
D. È usato per studiare la correlazione incrociata tra due serie temporali e la loro dipendenza da un'altra.
A. 10
B. 3
C. 1
D. 0.4
A. GLM (Formula, Family = FamilyType (link = linkFunction), data =)
B. GLM (Formula, Data =, Method =, Control =)
C. GLM (vettoriale, start =. end =, frequenza =)
D. GLM (BootObject. Conf =, type =)
A. Grepl.any (installato.packages ("xlsx")) libreria ("xlsx")
B. qualsiasi (Grepl ("xlsx", installato.package ())) libreria ("xlsx")
C. Any.grepl (xlsx, installato.package50) | ibrary (xlsx)
D. Grepl (Any (installato.Packages (xlsx)) | ibrary (xlsx)
A. Clustering
B. Categorizzazione
C. Visualizzazione
D. Estrazione delle informazioni
A. Algoritmo di segmentazione
B. Algoritmo di classificazione
C. Algoritmo di analisi della sequenza
D. Algoritmo di associazione
A. Match Associations [as pattern_name] analizza {misura (s)}
B. Mine Associations [as pattern_name] analizza classificati_attribute_or_dimension
C. Mine Associations [as [pattern_name]] {corrispondente {metapattern}}
D. Mine Associations [as pattern_name] analizza previsione_attribute_or_dimension {set [attribute_or_dimension_i = value_i}]
A. Regressione graduale
B. Regressione polinomiale
C. Regressione lineare
D. Regressione logistica
A. Supporta i tipi di contenuti ciclici, chiave e della tabella.
B. Supporta i tipi chiave, tabella e contenuto ordinati.
C. Supporta i tipi di contenuto continuo, chiave e tabella.
D. Supporta i tipi di contenuto continui, ciclici e ordinati.
A. Specifica come un modello dovrebbe essere miscelato per l'ottimizzazione delle previsioni.
B. Specifica quale algoritmo utilizzare per l'analisi e la previsione.
C. Specifica un valore numerico tra 0 e 1 che rileva la periodicità.
D. Specifica il numero minimo di fette di tempo necessarie per generare una divisione in ogni albero delle serie temporali.
A. 0.6
B. 0.1
C. 10
D. 1
A. Può essere utilizzato per produrre un'analisi dei componenti principali non classificati.
B. Può essere utilizzato per produrre analisi dei fattori di massima probabilità.
C. Può essere utilizzato per avviarsi il modello di equazione strutturale.
D. Può essere utilizzato per fuire un modello di media mobile integrato autoregressivo.
A. F -SCORE = RICHIAMA - Precision + (RICHIAME X Precision) / 9
B. F -SCORE = richiamo + precisione - (richiamo x precisione) i 7
C. F-SCORE = RICHIAME X Precision / (RICHIAME + PRECISION) / 2
D. F -Score = RICHIAMA I Precision X (RICHIAME - PRECISION) / 5
A. 10
B. 1
C. 0
D. 5
A. Analisi di regressione
B. Anova
C. Analisi dei fattori
D. Regressione logistica
A. Precisione: l [pertinente] n [recuperato] l / l [recuperato] l
B. Precision = L [recuperati} u [f-Score] l + l [f-Score} l
C. Precision = L [richiamo] / [f-Scorejl x l [recali] l
D. Precision = L [F -Score] x [richiamojl - l [f - punteggio) l
A. Precisione
B. Richiamare
C. F-Score
D. Nessuna delle precedenti
A. 200
B. 30
C. 255
D. 100
A. Viene utilizzato per modellare le variabili binarie.
B. Viene utilizzato per modellare i dati compositivi.
C. Viene utilizzato per modellare le variabili di rango.
D. Viene utilizzato per modellare le variabili di conteggio.
A. Metodo basato sulle frasi (PBM)
B. Metodo basato su termini (TBM)
C. Metodo tassonomia dei modelli (PTM)
D. Metodo basato su concetti (CBM)
A. Regressione della cresta
B. Regressione beta
C. Regressione di Loess
D. Regressione isotonica
A. MINIMINE_SUPPORT
B. Minimo_probabilità
C. MINIMINE_ITEMSET_SIZE
D. MINIMINE_ITEMSET_COUNT
A. (link = '' Identity ")
B. (link = '' iogit ")
C. (link = "" iog ")
D. (link = "inverso")
A. lsinnode (dmx)
B. Predictassociation (DMX)
C. PredictAdjustedProbability (DMX)
D. PredicTistogram (DMX)
A. Em non scalabile
B. Em scalabile
C. K scalabili K-Means
D. K-mean non scalabili
A. Tipo booleano
B. Valore del cluster
C. Tavolo
D. Valore scalare
A. Previsione_smoothing
B. Forecast_method
C. Instability_Sensity
D. Complessità_penalty
A. Si applica alle colonne del modello di mining.
B. Si applica alle colonne della struttura mineraria.
C. Si applica sia alle colonne del modello di mining che alle colonne della struttura mineraria.
D. Non si applica né alle colonne del modello di mining né alle colonne della struttura mineraria.
A. Semplice campionamento casuale
B. Campionamento casuale stratificato
C. Vasto campionamento f
D. Campionamento della quota
A. I dati possono essere raccolti più velocemente in un metodo di campionamento.
B. Un metodo di campionamento fornisce la struttura per organizzare ed eseguire comodamente il lavoro di ricerca.
C. È meno costoso.
D. Non è necessaria alcuna conoscenza specializzata per utilizzare un metodo di campionamento.
A. È adatto per dati tabulari con colonne eterogenee.
B. Solo i dati etichettati possono essere inseriti in una struttura di dati Panda.
C. È adatto per i dati di matrice arbitraria (tipizzato in modo omogeneo o eterogeneo) con etichette di riga e colonne.
D. I dati delle serie temporali ordinati e non ordinati (non necessariamente fxed-frequenza) possono essere analizzati con i panda.
A. Richiamare
B. F-Score
C. Precisione
D. Sia A e C
A. K-Means
B. C45
C. Em
D. A priori
A. matplotlib
B. panda
C. numpy
D. Sia a che c
A. Quando tutti i suoi superset immediati hanno lo stesso supporto dell'articolo.
B. Quando nessuno dei suoi sottoinsiemi immediati ha lo stesso supporto dell'articolo.
C. Quando tutti i suoi sottoinsiemi immediati hanno lo stesso supporto dell'articolo.
D. Quando nessuno dei suoi superset immediati ha lo stesso supporto dell'articolo.
A. 1/1024
B. 1023/1024
C. 11512
D. 511/512
A. Selezione delle caratteristiche
B. Preelaborazione del testo
C. Caratteristiche Generazione
D. Sia a che B
A. 0.60
B. 0.79
C. 0.45
D. 0.82
A. 0.88
B. 0.82
C. 0.95
D. 0.90
A. BETULLA
B. K-Means
C. PUNTURA
D. FCM
A. 2.5
B. 2.8
C. 3.2
D. 3.4
A. 11/11
B. 13/14
C. 1/14
D. 3/14
A. Campionamento del giudizio
B. Campionamento casuale stratificato
C. Campionamento del cluster
D. Campionamento casuale a più stadi
A. L1 In una rete di credenze, le indipendenti condizionali di classe possono essere definite tra i sottoinsiemi di variabili.
B. La distribuzione di probabilità condizionale congiunta VJ non può essere specificata dalle reti di credenze bayesiane.
C. VJ Una rete bayesiana addestrata non può essere utilizzata per la classificazione.
D. VJ Un modello grafico di relazioni casuali per l'esecuzione dell'apprendimento è fornito da Bayesian Belief Network.
A. Non vi è alcuna possibilità di pregiudizio personale in questo metodo.
B. È più accurato e affidabile.
C. È principalmente usato in quei campi in cui esistono unità quasi simili o alcune unità sono troppo importanti "per essere lasciate fuori dal campione.
D. È molto costoso.
A. n (xl0) p (x)
B. n (0) p (x)
C. n (0) p (xl0)
D. nl (x) p (0lx)
Quale dei seguenti comandi viene utilizzato per osservare il modo in cui un oggetto R è strutturato? È dato che MyData è una variabile in cui vengono archiviati i dati di un utente.
A. Biblioteca (mydata)
B. Descrivi (mydata)
C. str (mydata)
D. Riepilogo (mydata)
A. Supporto per Hadoop
B. Analisi della memoria LN
C. Grid computing
D. elaborazione del database ln
A. ipython —pylab = in | ine
B. ipython —pylab = inline -notebook
C. ipython = notebook —pylab.in | ine
D. Ipython Notebook —Pylab = inline
A. P (x/h) = p (h/x) p (h)/p (x)
B. P (h/x) = p (x/h) p (h)/p (x)
C. P (h/x) = p (x/h) p (x)/p (h)
D. P (xih) = p (h/x)/p (h) p (x)
A. Permette un solo risultato.
B. Un algoritmo a passaggio singolo derivato dai limiti binomiali di configurazione è usato da C45.
C. Utilizza criteri basati sull'informazione.
A. Referrals traffic
B. Traffico organico
C. Traffico diretto
D. Traffico sociale
A. Analisi di acquisizione
B. Analisi del pubblico
C. Analisi del comportamento
D. Analisi di conversione
A. Regole sequenziali
B. Regole di associazione generalizzata
C. Mining di pattern sequenziali
D. Warmr
A. Errori dovuti a misure statistiche errate.
B. Errori nella compilazione.
C. Inquadratura di un questionario sbagliato.
D. Demarcazione difettosa delle unità di campionamento.
A. Richiamo = l [pertinente} u [recuperato] l l l [pertinente}!
B. Richiamo = l [pertinente} u [recuperato] | l l {recuperato] l
C. Richiamo = l [rilevante} fl {recuperato} | / l [recuperato] l
D. Richiamo = l [pertinente} n [recuperato} l / l [pertinente
A. Seleziona (DataFrameName, espressione logica)
B. filter (espressione logica, datiFrameName)
C. filter (dataframeName, espressione logica)
D. Seleziona (espressione logica, dataframeMame)
A. Survit ()
B. coxph ()
C. Surviff ()
D. Survitfit ()
A. Analisi dell'evoluzione
B. Predizione
C. Analisi anomalo
D. Mining of Associations
A. Viene utilizzato per trasformare i dati in azioni.
B. Supporta e incoraggia lo spostamento tra ragionamento deduttivo e induttivo.
C. Al fine di raggiungere il successo. Le organizzazioni devono raggiungere la massima maturità della scienza dei dati.
D. È necessario che le aziende rimangano con il pacchetto e competere in futuro.
A. CURA
B. ROCCIA
C. BETULLA
D. Camaleonte
A. In questo approccio sono necessari complessi processi di integrazione e infgli è richiesto.
B. Questo approccio consente di copiare i dati. elaborato. integrato. annotato. Riassunto e ristrutturato in anticipo in un archivio di dati semantici.
C. È molto economico per le domande che richiedono aggregazioni.
D. È considerevolmente più efficiente per le domande frequenti.
A. Media = 3 e deviazione standard = /5
B. Media = 5 e deviazione standard = /3
C. Media = 5 e deviazione standard = /'5
D. Media = 7 e deviazione standard = /7
A. stl0
B. Tso
C. Etso
D. arimao
A. Modello di classificazione
B. Modello di previsione
C. Sia a che B
D. Nè a nè B
A. Gestione delle informazioni per big data
B. Analisi ad alte prestazioni per i big data
C. Opzioni di distribuzione flessibili per i big data
A. conf (a => b) = supp (a u b) / supp (a)
B. conf (a => b) = supp (b) / supp (a)
C. conf (a => b) = supp (a u b) / supp (a) "Supp (b)
D. conf (a => b) = supp (a u b) / 1 - supp (a)
A. 0.31
B. 0.42
C. 0,51
D. 0.67
A. su 5 ll
B. P0 = L1
C. PO 2 p
A. Un nodo interno
B. Un nodo foglia
C. Un ramo
D. Il nodo più alto
A. Fornisce un approccio di architettura rigido.
B. Può gestire e sfruttare solo un modello alla volta.
C. È posizionato in modo univoco per aiutare le organizzazioni a trasformare i big data e l'analisi dei big data in valore aziendale.
D. Entrambe le opzioni A e C sono corrette.
A. Mette i dati in forma precisa e condensata.
B. L'analisi statistica LL è possibile per tutti i tipi di dati tranne i dati classificati.
C. Ii] non consente il confronto tra varie caratteristiche.
D. Rende i dati più facilmente comprensibili eliminando dettagli inutili.
A. Genera previsioni di Jacknifed.
B. Viene utilizzato per ottenere la funzione discriminante quadratica.
C. Stampa funzioni discriminanti in base a variabili centrate, ma non standardizzate.
D. Può visualizzare i risultati di una classificazione lineare o quadratica con due variabili alla volta.
A. Modello di classificazione dell'albero decisionale
B. Modello di classificazione dell'ensemble
C. Modello di classificazione dell'iperplana
D. Nessun modello di classificazione è costruito da KNN
A. Foil_prune = p - n/p + n
B. Foil_prune = p + n/p - n
C. Foil_prune = p/n
D. Foil_prune = n/p + n
A. Monomiale
B. Binomiale
C. Trinomiale
D. multinomiale
A. Un campione t: test
B. Campioni accoppiati t: test
C. Campioni indipendenti test t
D. Analisi della varianza (ANOVA)
A. Genera solo un set di elementi il cui supporto 2 minsup
B. Genera tutti i set di articoli il cui supporto 5 minsup
C. Genera tutti i set di articoli il cui supporto 5 minsup
D. Genera regole di alta fiducia da ciascun set di articoli frequenti
A. Obiettivo di pagine/sessione
B. Obiettivo di durata
C. Obiettivo di destinazione
D. Obiettivi dell'evento
A. ? mediana
B. Leggi.MEDIAN0
C. #mediano
D. aiuto.MEDIAN0
A. Tempo di caricamento della pagina per browser
B. Vendita totale per prodotti
C. Conversione per post sul blog
D. Fonte di traffico in tempo reale
A. e g r 0d
B. A = R2D
C. o c 2dr
D. a e drz
A. Rifiutare l'ipotesi nulla
B. Non riesce a rifiutare l'ipotesi nulla
C. L'accettazione o il rifiuto dell'ipotesi nulla sono indipendenti dal valore p.
A. 10
B. 1
C. 0
D. 5
A. Utilizzare database database_name
B. Utilizzare data warehouse data_warehouse_name
C. Database.usedatabase_name
D. Datawarehouse.usedata_warehouse_name
A. Compressione senza perdita
B. Compressione perdita
C. Bitmap
D. Visualizzazione dati
A. Variabili
B. Tipi di dati astratti (ADTS)
C. Funzioni
D. Parametri
E. Nessuna di queste
A. Bookmarking sociale
B. Ricerca
C. Gruppo di discussione
D. Comunicazione sincrona
A. Dati infetti da virus
B. Dati infetti da worm
C. Dati imprecisi e incompleti
D. Dati rubati
A. Modulo
B. Formato
C. Visualizzazione
D. Documentazione
A. Orizzontale
B. Fine frontale
C. Back-end
D. Verticale
A. Governance dei dati aziendali
B. Sistemi di informazione proprietari
C. Business intelligence
D. Processi di business