Domande di Data Analytics in lingua italiana

Domande di Data Analytics in lingua italiana

Metti alla prova la tua comprensione degli argomenti di analisi dei dati rispondendo a oltre 100 MCQ di analisi dei dati.
Scorri verso il basso per iniziare!

1: Quale dei seguenti tipi di analisi delle serie temporali mira a separare i componenti periodici o ciclici in una serie temporale?

A.   Analisi esplicativa

B.   Analisi spettrale

C.   Previsione

D.   Analisi descrittiva

2: Quali delle seguenti opzioni rappresentano l'applicazione corretta del mining delle regole dell'associazione?

A.   Design del catalogo

B.   Analisi dei dati del paniere

C.   Marketing incrociato

D.   Analisi del leader perdita

E.   Tutti i precedenti

F.   Nessuna delle precedenti

3: Quali delle seguenti opzioni sono/sono le applicazioni corrette del mining di testo?

A.   Può elaborare automaticamente messaggi ed e -mail.

B.   Può indagare sui concorrenti strisciando i loro siti Web.

C.   Può analizzare le risposte al sondaggio aperto.

D.   Può analizzare la garanzia o i reclami assicurativi.

E.   Tutti i precedenti.

4: Rispetto all'algoritmo di rete neurale Microsoft. Quale delle seguenti opzioni è il tipo di neurone che rappresenta valori di attributo prevedibili per un modello di data mining?

A.   Neurone di ingresso

B.   Neurone nascosto

C.   Neurone di output

D.   Nessuna delle precedenti

5: Quali delle seguenti opzioni sono/sono corrette sull'algoritmo Microsoft Naive Bayes?

A.   Viene utilizzato per calcolare la probabilità condizionale tra ingresso e colonne prevedibili e presuppone che le colonne siano indipendenti.

B.   Viene utilizzato per l'esecuzione della selezione automatica delle caratteristiche per limitare il numero di valori che vengono considerati durante la costruzione di un modello.

C.   È fornito da Microsoft SQL Server Analysis Services per l'uso nella modellazione predittiva.

D.   Viene utilizzato per considerare ogni coppia di valori di attributo di input e valori degli attributi di output.

E.   Tutti i precedenti.

6: Quale delle seguenti opzioni è corretta sulla tecnica di regressione logistica?

A.   È usato per incoraggiare l'effetto di gruppo in caso di variabili altamente correlate.

B.   Viene utilizzato per trovare la probabilità di event = successo e event = fallimento.

C.   Viene utilizzato per l'aggiunta e la rimozione dei predittori secondo necessità per ogni passaggio.

D.   È usato per penalizzare la dimensione assoluta dei coefficienti di regressione.

7: Nel data mining, quale delle seguenti opzioni è corretta sull'algoritmo di regressione?

A.   È usato per prevedere una o più variabili numeriche continue; Per esempio. profitto o perdita che si basa su altri attributi in un set di dati.

B.   Viene utilizzato per trovare correlazioni tra diversi attributi in un set di dati.

C.   Viene utilizzato per dividere i dati in gruppi o cluster di elementi che hanno proprietà simili.

D.   Viene utilizzato per riassumere sequenze o episodi frequenti nei dati; Per esempio. Una serie di eventi di registro che precedono la manutenzione della macchina.

8: Secondo il modello di regole di Associazione Microsoft. Quale delle seguenti opzioni è la scheda Visualizzatore corretta che combina informazioni sugli elementi e sul loro valore relativo?

A.   Ltemset

B.   Rete di dipendenza

C.   Regole

D.   Nessuna delle precedenti

9: Quale delle seguenti affermazioni è corretta sul tipo di analisi di intervento dell'analisi delle serie temporali?

A.   È usato per indicare se un evento può portare a una modifica in una serie temporale.

B.   Viene utilizzato per indicare una tendenza o un modello in una serie temporale attraverso l'uso di grafici o altri strumenti.

C.   Viene ampiamente utilizzato nel budget. che si basa su tendenze storiche.

D.   È usato per studiare la correlazione incrociata tra due serie temporali e la loro dipendenza da un'altra.

10: Quale dei seguenti è il valore predefinito corretto del parametro Maximum_Itemset_Size, che viene utilizzato con l'algoritmo delle regole di Associazione Microsoft?

A.   10

B.   3

C.   1

D.   0.4

11: Per quanto riguarda le statistiche avanzate, quale delle seguenti opzioni è la sintassi corretta della funzione GLM ()?

A.   GLM (Formula, Family = FamilyType (link = linkFunction), data =)

B.   GLM (Formula, Data =, Method =, Control =)

C.   GLM (vettoriale, start =. end =, frequenza =)

D.   GLM (BootObject. Conf =, type =)

12: Quale delle seguenti è la sintassi corretta del comando che verificherà l'installazione del pacchetto XLSX e carichi la libreria in Apazza di lavoro R?

A.   Grepl.any (installato.packages ("xlsx")) libreria ("xlsx")

B.   qualsiasi (Grepl ("xlsx", installato.package ())) libreria ("xlsx")

C.   Any.grepl (xlsx, installato.package50) | ibrary (xlsx)

D.   Grepl (Any (installato.Packages (xlsx)) | ibrary (xlsx)

13: Quale delle seguenti tecniche di estrazione del testo può essere utilizzata per fumare gruppi di documenti con contenuti simili?

A.   Clustering

B.   Categorizzazione

C.   Visualizzazione

D.   Estrazione delle informazioni

14: Nel data mining del server SOL, quale dei seguenti tipi di algoritmo prevede una o più variabili discrete basate su altri attributi in un set di dati?

A.   Algoritmo di segmentazione

B.   Algoritmo di classificazione

C.   Algoritmo di analisi della sequenza

D.   Algoritmo di associazione

15: Nel data mining, quale delle seguenti opzioni è la sintassi corretta per l'associazione?

A.   Match Associations [as pattern_name] analizza {misura (s)}

B.   Mine Associations [as pattern_name] analizza classificati_attribute_or_dimension

C.   Mine Associations [as [pattern_name]] {corrispondente {metapattern}}

D.   Mine Associations [as pattern_name] analizza previsione_attribute_or_dimension {set [attribute_or_dimension_i = value_i}]

16: Quale delle seguenti tecniche di regressione tenta di massimizzare la potenza di previsione con il numero minimo di variabili predittive?

A.   Regressione graduale

B.   Regressione polinomiale

C.   Regressione lineare

D.   Regressione logistica

17: Quale delle seguenti affermazioni è corretta sulla colonna prevedibile supportata dall'algoritmo di regressione lineare Microsoft?

A.   Supporta i tipi di contenuti ciclici, chiave e della tabella.

B.   Supporta i tipi chiave, tabella e contenuto ordinati.

C.   Supporta i tipi di contenuto continuo, chiave e tabella.

D.   Supporta i tipi di contenuto continui, ciclici e ordinati.

18: Quale delle seguenti affermazioni è corretta sul parametro previsione_smoothing utilizzato nell'algoritmo delle serie temporali Microsoft?

A.   Specifica come un modello dovrebbe essere miscelato per l'ottimizzazione delle previsioni.

B.   Specifica quale algoritmo utilizzare per l'analisi e la previsione.

C.   Specifica un valore numerico tra 0 e 1 che rileva la periodicità.

D.   Specifica il numero minimo di fette di tempo necessarie per generare una divisione in ogni albero delle serie temporali.

19: Quale dei seguenti è il valore predefinito corretto per il parametro Instability_Sensity utilizzato con l'algoritmo delle serie temporali Microsoft?

A.   0.6

B.   0.1

C.   10

D.   1

20: Per quanto riguarda le statistiche avanzate, quale delle seguenti opzioni è corretta sulla funzione Arimao?

A.   Può essere utilizzato per produrre un'analisi dei componenti principali non classificati.

B.   Può essere utilizzato per produrre analisi dei fattori di massima probabilità.

C.   Può essere utilizzato per avviarsi il modello di equazione strutturale.

D.   Può essere utilizzato per fuire un modello di media mobile integrato autoregressivo.

21: Nel data mining, quale delle seguenti opzioni è corretta sulla misura del punteggio F per il recupero del testo?

A.   F -SCORE = RICHIAMA - Precision + (RICHIAME X Precision) / 9

B.   F -SCORE = richiamo + precisione - (richiamo x precisione) i 7

C.   F-SCORE = RICHIAME X Precision / (RICHIAME + PRECISION) / 2

D.   F -Score = RICHIAMA I Precision X (RICHIAME - PRECISION) / 5

22: Quale dei seguenti è il valore predefinito del parametro storico_model_gap utilizzato nell'algoritmo delle serie temporali Microsoft?

A.   10

B.   1

C.   0

D.   5

23: Quale delle seguenti tecniche statistiche avanzate viene utilizzata per identificare le variabili latenti che formano gruppi?

A.   Analisi di regressione

B.   Anova

C.   Analisi dei fattori

D.   Regressione logistica

24: Nel data mining, quale delle seguenti opzioni definisce correttamente la precisione, che viene utilizzata per valutare la qualità del recupero del testo?

A.   Precisione: l [pertinente] n [recuperato] l / l [recuperato] l

B.   Precision = L [recuperati} u [f-Score] l + l [f-Score} l

C.   Precision = L [richiamo] / [f-Scorejl x l [recali] l

D.   Precision = L [F -Score] x [richiamojl - l [f - punteggio) l

25: Quale delle seguenti misure di recupero del testo è la percentuale di documenti, che sono rilevanti per la query e sono stati effettivamente recuperati?

A.   Precisione

B.   Richiamare

C.   F-Score

D.   Nessuna delle precedenti

26: Quale dei seguenti è il valore predefinito corretto del parametro HoldOut_PerCentage dell'algoritmo di regressione logistica Microsoft, che viene utilizzato per specificare la percentuale di casi all'interno dei dati di addestramento utilizzati per calcolare un errore di mantenimento?

A.   200

B.   30

C.   255

D.   100

27: Nelle statistiche avanzate, quale delle seguenti affermazioni è corretta sul metodo di regressione di Dirichlet?

A.   Viene utilizzato per modellare le variabili binarie.

B.   Viene utilizzato per modellare i dati compositivi.

C.   Viene utilizzato per modellare le variabili di rango.

D.   Viene utilizzato per modellare le variabili di conteggio.

28: In quale dei seguenti metodi di estrazione del testo, i termini vengono analizzati a livello di frase e documento?

A.   Metodo basato sulle frasi (PBM)

B.   Metodo basato su termini (TBM)

C.   Metodo tassonomia dei modelli (PTM)

D.   Metodo basato su concetti (CBM)

29: In statistiche avanzate. Quale dei seguenti metodi di regressione viene utilizzato per modellare le variabili all'interno dell'intervallo (0, 1)?

A.   Regressione della cresta

B.   Regressione beta

C.   Regressione di Loess

D.   Regressione isotonica

30: Secondo l'algoritmo delle regole di Associazione Microsoft, quale dei seguenti parametri specifica il numero minimo di casi che devono contenere un set di elementi prima che l'algoritmo genera una regola?

A.   MINIMINE_SUPPORT

B.   Minimo_probabilità

C.   MINIMINE_ITEMSET_SIZE

D.   MINIMINE_ITEMSET_COUNT

31: Secondo le statistiche avanzate modello lineare generalizzato, quale dei seguenti è la funzione di collegamento predefinita per la famiglia gaussiana?

A.   (link = '' Identity ")

B.   (link = '' iogit ")

C.   (link = "" iog ")

D.   (link = "inverso")

32: Secondo l'algoritmo delle regole dell'associazione Microsoft, quale delle seguenti opzioni è la funzione di previsione con valore scalare come tipo di restituzione?

A.   lsinnode (dmx)

B.   Predictassociation (DMX)

C.   PredictAdjustedProbability (DMX)

D.   PredicTistogram (DMX)

33: Quale delle seguenti opzioni è il clustering_method predefinito utilizzato dall'algoritmo di clustering Microsoft?

A.   Em non scalabile

B.   Em scalabile

C.   K scalabili K-Means

D.   K-mean non scalabili

34: Quale delle seguenti opzioni è il tipo di restituzione corretto della funzione di previsione di Predicthistogram (DMX) utilizzata dall'algoritmo di regressione logistica Microsoft?

A.   Tipo booleano

B.   Valore del cluster

C.   Tavolo

D.   Valore scalare

35: Quale delle seguenti opzioni è il parametro dell'algoritmo delle serie temporali Microsoft, che viene utilizzato per controllare la crescita di un albero decisionale?

A.   Previsione_smoothing

B.   Forecast_method

C.   Instability_Sensity

D.   Complessità_penalty

36: Quale delle seguenti affermazioni è corretta sul flag di modellazione non nullo utilizzato nell'algoritmo delle serie temporali Microsoft?

A.   Si applica alle colonne del modello di mining.

B.   Si applica alle colonne della struttura mineraria.

C.   Si applica sia alle colonne del modello di mining che alle colonne della struttura mineraria.

D.   Non si applica né alle colonne del modello di mining né alle colonne della struttura mineraria.

37: Quale dei seguenti metodi di campionamento viene utilizzato per le unità eterogenee dell'universo piuttosto che le unità omogenee e può essere adottata solo quando la sua popolazione è nota?

A.   Semplice campionamento casuale

B.   Campionamento casuale stratificato

C.   Vasto campionamento f

D.   Campionamento della quota

38: Quale delle seguenti affermazioni non è corretta sui metodi di campionamento?

A.   I dati possono essere raccolti più velocemente in un metodo di campionamento.

B.   Un metodo di campionamento fornisce la struttura per organizzare ed eseguire comodamente il lavoro di ricerca.

C.   È meno costoso.

D.   Non è necessaria alcuna conoscenza specializzata per utilizzare un metodo di campionamento.

39: Quale delle seguenti affermazioni non è corretta sui panda?

A.   È adatto per dati tabulari con colonne eterogenee.

B.   Solo i dati etichettati possono essere inseriti in una struttura di dati Panda.

C.   È adatto per i dati di matrice arbitraria (tipizzato in modo omogeneo o eterogeneo) con etichette di riga e colonne.

D.   I dati delle serie temporali ordinati e non ordinati (non necessariamente f‌xed-frequenza) possono essere analizzati con i panda.

40: Quale delle seguenti misure fondamentali utilizzate per valutare la qualità del recupero del testo rappresenta la percentuale di documenti recuperati rilevanti per una query?

A.   Richiamare

B.   F-Score

C.   Precisione

D.   Sia A e C

41: Quale dei seguenti algoritmi di data mining è applicato a un database contenente un gran numero di transazioni e apprende anche le regole dell'associazione?

A.   K-Means

B.   C45

C.   Em

D.   A priori

42: Mentre si lavora in un ambiente Pylab, quali delle seguenti opzioni non devono essere importate?

A.   matplotlib

B.   panda

C.   numpy

D.   Sia a che c

43: Nell'estrazione delle regole dell'associazione, un set di articoli è considerato chiuso in quale delle seguenti situazioni?

A.   Quando tutti i suoi superset immediati hanno lo stesso supporto dell'articolo.

B.   Quando nessuno dei suoi sottoinsiemi immediati ha lo stesso supporto dell'articolo.

C.   Quando tutti i suoi sottoinsiemi immediati hanno lo stesso supporto dell'articolo.

D.   Quando nessuno dei suoi superset immediati ha lo stesso supporto dell'articolo.

44: Si è dato che A e B sono due variabili binomiali indipendenti con parametri 3,114 e 2,1/4, rispettivamente. Trova P (A + B 21).

A.   1/1024

B.   1023/1024

C.   11512

D.   511/512

45: Il modello Bag-of Worde viene utilizzato in quale dei seguenti processi di estrazione del testo?

A.   Selezione delle caratteristiche

B.   Preelaborazione del testo

C.   Caratteristiche Generazione

D.   Sia a che B

46: Per un gruppo di 12 studenti, la somma dei quadrati di differenze nei loro ranghi per la scienza e la matematica è data 60. Sulla base delle informazioni fornite. Trova il valore del coefficiente di correlazione dei ranghi.

A.   0.60

B.   0.79

C.   0.45

D.   0.82

47: Durante il calcolo del coefficiente di correlazione dei ranghi tra vendite e spese per un periodo di tempo di 12 anni. La differenza di rango per un anno è stata erroneamente presa come 9 anziché 7 e, di conseguenza, il valore del coefficiente di correlazione dei ranghi è stato calcolato come 0,79. Se l'errore viene rettificato, allora quale sarà il valore corretto approssimativo del coefficiente di correlazione dei ranghi?

A.   0.88

B.   0.82

C.   0.95

D.   0.90

48: Quale dei seguenti algoritmi di clustering viene utilizzato per il partizionamento a base di griglia?

A.   BETULLA

B.   K-Means

C.   PUNTURA

D.   FCM

49: È dato che ci sono 15 coppie di letture su xey in modo tale che il coefficiente di correlazione sia 0,87. È inoltre dato che la deviazione standard è 5,60. Quale sarà l'errore standard approssimativo di stima di y su x?

A.   2.5

B.   2.8

C.   3.2

D.   3.4

50: Sam è popolare per aver colpito un bersaglio in 6 colpi su 12, mentre John può colpire lo stesso bersaglio in 8 su 14 colpi. Quale sarà la probabilità che l'obiettivo venga colpito quando entrambi provano?

A.   11/11

B.   13/14

C.   1/14

D.   3/14