MCQ-Datenanalyse (kostenlose Multiple-Choice-Fragen)

1: Welche der folgenden Arten von Zeitreihenanalysen zielt darauf ab, periodische oder zyklische Komponenten in einer Zeitreihe zu trennen?

A. Erläuterungsanalyse

B. Spektralanalyse

C. Vorhersage

D. Beschreibende Analyse

2: Welche der folgenden Optionen repräsentieren (en) die korrekte Anwendung des Assoziationsregel -Mining?

A. Katalogdesign

B. Korbdatenanalyse

C. Cross-Marketing

D. Verlustladeranalyse

E. Alles das oben Genannte

F. Nichts des oben Genannten

3: Welche der folgenden Optionen ist/sind die richtigen Anwendungen des Textminens?

A. Es kann automatisch Nachrichten und E -Mails verarbeiten.

B. Es kann Wettbewerber untersuchen, indem sie ihre Websites kriechen.

C. Es kann offene Umfrageantworten analysieren.

D. Es kann Garantie- oder Versicherungsansprüche analysieren.

E. Alles das oben Genannte.

4: In Bezug auf Microsoft Neural Network Algorithmus. Welche der folgenden Optionen ist der Neuronentyp, der vorhersehbare Attributwerte für ein Data Mining -Modell darstellt?

A. Eingabeneuron

B. Verstecktes Neuron

C. Ausgangsneuron

D. Nichts des oben Genannten

5: Welche der folgenden Optionen ist/sind korrekt für den Microsoft Naive Bayes -Algorithmus?

A. Es wird zur Berechnung der bedingten Wahrscheinlichkeit zwischen Eingangs- und vorhersehbaren Spalten verwendet und wird davon ausgegangen, dass die Spalten unabhängig sind.

B. Es wird zur Durchführung der automatischen Feature -Auswahl verwendet, um die Anzahl der Werte zu begrenzen, die beim Erstellen eines Modells berücksichtigt werden.

C. Es wird von Microsoft SQL Server Analysis Services zur Verwendung in der Vorhersagemodellierung bereitgestellt.

D. Es wird verwendet, um jedes Paar Eingabeattributwerte und Ausgangsattributwerte zu berücksichtigen.

E. Alles das oben Genannte.

6: Welche der folgenden Optionen ist für die logistische Regressionstechnik korrekt?

A. Es wird zur Förderung des Gruppeneffekts bei stark korrelierten Variablen verwendet.

B. Es wird verwendet, um die Wahrscheinlichkeit eines Ereignisses zu finden = Erfolg und Ereignis = Misserfolg.

C. Es wird zum Hinzufügen und Entfernen von Prädiktoren bei Bedarf für jeden Schritt verwendet.

D. Es wird verwendet, um die absolute Größe der Regressionskoeffizienten zu bestrafen.

7: Welche der folgenden Optionen ist im Data Mining für den Regressionsalgorithmus richtig?

A. Es wird zur Vorhersage eines oder mehreren kontinuierlichen numerischen Variablen verwendet; Zum Beispiel. Gewinn oder Verlust, der auf anderen Attributen in einem Datensatz basiert.

B. Es wird verwendet, um Korrelationen zwischen verschiedenen Attributen in einem Datensatz zu finden.

C. Es wird verwendet, um Daten in Gruppen oder Cluster von Elementen mit ähnlichen Eigenschaften aufzuteilen.

D. Es wird verwendet, um häufige Sequenzen oder Episoden in Daten zusammenzufassen. Zum Beispiel. Eine Reihe von Protokollereignissen vor der Maschinenwartung.

8: Gemäß dem Microsoft Association Rules -Modell. Welche der folgenden Optionen ist die Registerkarte Richtiger Zuschauer, die Informationen zu ElementsSets und ihrem relativen Wert kombiniert?

A. ltemsets

B. Abhängigkeitsnetzwerk

C. Regeln

D. Nichts des oben Genannten

9: Welche der folgenden Aussagen ist für den Typ der Interventionsanalyse der Zeitreihenanalyse korrekt?

A. Es wird verwendet, um festzustellen, ob ein Ereignis zu einer Änderung einer Zeitreihe führen kann.

B. Es wird verwendet, um einen Trend oder ein Muster in einer Zeitreihe durch die Verwendung von Diagrammen oder anderen Tools zu erstellen.

C. Es wird ausgiebig bei der Budgetierung verwendet. das basiert auf historischen Trends.

D. Es wird zur Untersuchung der Kreuzkorrelation zwischen zwei Zeitreihen und ihrer Abhängigkeit von einem anderen verwendet.

10: Welche der folgenden Aussagen ist der korrekte Standardwert des Parameters maximum_itemset_size, der mit dem Microsoft Association Rules -Algorithmus verwendet wird?

A. 10

B. 3

C. 1

D. 0,4

11: Welche der folgenden Optionen ist in Bezug auf fortschrittliche Statistiken die richtige Syntax der GLM () -Funktion?

A. GLM (Formel, familie = familientyp (link = linkFunction), Daten =)

B. GLM (Formel, Daten =, Methode =, Kontrolle =)

C. GLM (Vektor, Start =. End =, Frequenz =)

D. GLM (BootObject. Conf =, Typ =)

12: Welche der folgenden Aussagen ist die korrekte Syntax des Befehls, die die Installation des XLSX -Pakets überprüfen und die Bibliothek in den R -Arbeitsbereich lädt?

A. Grepl.any (installed.packages ("xlsx")) Bibliothek ("xlsx")

B. beliebig (Grepl ("xlsx", installed.package ()) bibliothek ("xlsx")

C. any.grepl (xlsx, installiert.package50) | Ibrary (xlsx)

D. Grepl (alle (installiert.packages (xlsx))) | Ibrary (xlsx)

13: Welche der folgenden Text -Mining -Techniken kann verwendet werden, um Gruppen von Dokumenten mit ähnlichem Inhalt zu erfassen?

A. Clustering

B. Kategorisierung

C. Visualisierung

D. Informationsextraktion

14: Welche der folgenden Algorithmus -Typen prognostiziert im SOL Server Data Mining eine oder mehrere diskrete Variablen, die auf anderen Attributen in einem Datensatz basieren?

A. Segmentierungsalgorithmus

B. Klassifizierungsalgorithmus

C. Sequenzanalysealgorithmus

D. Assoziationsalgorithmus

15: Welche der folgenden Optionen ist im Data Mining die richtige Syntax für die Assoziation?

A. Übereinstimmung Assoziationen [als mustername] analysieren {mess (s)}

B. Mine Assoziationen [als mustername] analysieren klassifizing_attribute_or_dimension

C. Mine Assoziationen [als [MUSTER_NAME]] {Matching {metapattern}}

D. Mine Assoziationen [als mustername] Analysieren Sie die prediction_attribute_or_dimension {set [Attribute_or_dimension_i = value_i}]

16: Welche der folgenden Regressionstechniken versucht, die Vorhersageleistung mit minimaler Anzahl von Prädiktorvariablen zu maximieren?

A. Schrittweise Regression

B. Polynomregression

C. Lineare Regression

D. Logistische Regression

17: Welche der folgenden Aussagen ist richtig für die vorhersehbare Spalte, die vom Microsoft Linear Regressionsalgorithmus unterstützt wird?

A. Es unterstützt die zyklischen, Schlüssel- und Tabelleninhaltstypen.

B. Es unterstützt den Schlüssel, die Tabelle und den geordneten Inhaltstypen.

C. Es unterstützt die kontinuierlichen, Schlüssel- und Tabelleninhaltstypen.

D. Es unterstützt die kontinuierlichen, zyklischen und geordneten Inhaltstypen.

18: Welche der folgenden Aussagen ist richtig für den Parameter Prediction_Smoothing, der im Microsoft Time Sery -Algorithmus verwendet wird?

A. Es spezifiziert, wie ein Modell zur Optimierung der Prognose gemischt werden sollte.

B. Es gibt an, welchen Algorithmus zur Analyse und Vorhersage verwendet werden soll.

C. Es spezifiziert einen numerischen Wert zwischen 0 und 1, der Periodizität erfasst.

D. Es spezifiziert die minimale Anzahl von Zeitscheiben, die erforderlich sind, um einen Aufteil in jedem Zeitreihenbaum zu erzeugen.

19: Welche der folgenden Aussagen ist der korrekte Standardwert für den Parameter Instability_sensitivity, der mit dem Microsoft Time -Series -Algorithmus verwendet wird?

A. 0,6

B. 0,1

C. 10

D. 1

20: Welche der folgenden Optionen ist in Bezug auf fortschrittliche Statistiken in Bezug auf die Arimao -Funktion korrekt?

A. Es kann verwendet werden, um eine unbehandelte Hauptkomponentenanalyse zu erstellen.

B. Es kann verwendet werden, um eine maximale Wahrscheinlichkeitsanalyse zu erstellen.

C. Es kann verwendet werden, um das Strukturgleichungsmodell zu starten.

D. Es kann verwendet werden, um ein autoregressives integriertes gleitendes Durchschnittsmodell zu fördern.

21: Welche der folgenden Optionen ist im Data Mining für die F-Score-Maßnahme für das Abrufen von Text korrekt?

A. F -Score = Rückruf - Präzision + (Rückruf x Präzision) / 9

B. F -Score = Rückruf + Präzision - (Rückruf x Präzision) i 7

C. F-Score = Rückruf x Präzision / (Rückruf + Präzision) / 2

D. F -score = rechnen i precision X (Rückruf - Präzision) / 5

22: Welche der folgenden Aussagen ist der Standardwert des Parameter Historical_Model_GAP, der im Microsoft -Zeitreihenalgorithmus verwendet wird?

A. 10

B. 1

C. 0

D. 5

23: Welche der folgenden erweiterten Statistiktechniken wird zur Identifizierung latenter Variablen verwendet, die Gruppen bilden?

A. Regressionsanalyse

B. Anova

C. Faktorenanalyse

D. Logistische Regression

24: Welche der folgenden Optionen hat in der Data Mining die Präzision korrekt definiert, die zur Beurteilung der Qualität des Textabrufs verwendet werden?

A. Präzision: l [relevant] n [abgerufen] l / l [abgerufen] l

B. Precision = l [abgerufen} u [f-score] l + l [f-score} l

C. Precision = l [rechnen] / [f-scorejl x l [recali] l

D. Precision = l [f -score] x [relastjl - l [f - score) l

25: Welche der folgenden Maßnahmen zur Abrufen von Text ist der Prozentsatz der Dokumente, die für die Abfrage relevant sind und tatsächlich abgerufen wurden?

A. Präzision

B. Abrufen

C. F-Score

D. Nichts des oben Genannten

26: Welcher der folgenden Aussagen ist der korrekte Standardwert des Parameters von Holdout_percentage des Microsoft Logistic Regressionsalgorithmus, der zum Angeben des Prozentsatzes der Fälle innerhalb der Trainingsdaten verwendet wird, die zur Berechnung eines Holdout -Fehlers verwendet werden?

A. 200

B. 30

C. 255

D. 100

27: Welche der folgenden Aussagen ist in fortgeschrittenen Statistiken über die Dirichlet -Regressionsmethode korrekt?

A. Es wird verwendet, um binäre Variablen zu modellieren.

B. Es wird verwendet, um Zusammensetzungsdaten zu modellieren.

C. Es wird verwendet, um Rangvariablen zu modellieren.

D. Es wird verwendet, um Zählvariablen zu modellieren.

28: In welcher der folgenden Textmining -Methoden werden Begriffe auf Satz- und Dokumentebene analysiert?

A. Phrase-basierte Methode (PBM)

B. Term-basierte Methode (TBM)

C. Muster -Taxonomiemethode (PTM)

D. Konzeptbasierte Methode (CBM)

29: In fortgeschrittenen Statistiken. Welche der folgenden Regressionsmethoden wird verwendet, um Variablen innerhalb des Bereichs (0, 1) zu modellieren?

A. Ridge Regression

B. Beta -Regression

C. Lösungsregression

D. Isotonische Regression

30: Welche der folgenden Parameter enthält gemäß dem Microsoft Association Rules -Algorithmus die Mindestanzahl von Fällen, die eine Elementen enthalten müssen, bevor der Algorithmus eine Regel generiert?

A. Minimum_support

B. Minimum_Probability

C. Minimum_itemset_size

D. Minimum_itemset_count

31: Welche der folgenden Linksfunktionen für die Gaußsche Familie lautet gemäß Advanced Statistics Generalized Linearmodell?

A. (Link = '' Identität ")

B. (link = '' iogit ")

C. (link = '' iog ")

D. (link = "inverse")

32: Welche der folgenden Optionen ist laut Microsoft Association Rules -Algorithmus die Vorhersagefunktion mit dem Skalarwert als Rückgabeart?

A. Lsiinnode (DMX)

B. Predictassociation (DMX)

C. PredictAdjustedProbability (DMX)

D. Prädikthistogramm (DMX)

33: Welche der folgenden Optionen ist der Standard -Clustering_Method, der vom Microsoft -Clustering -Algorithmus verwendet wird?

A. Nicht skalierbare Em

B. Skalierbare em

C. Skalierbares K-Mittel

D. Nicht skalierbare K-Means

34: Welche der folgenden Optionen ist der korrekte Rückgabetyp der Vorhersagefunktion des PredicThistogram (DMX), die vom Microsoft Logistic Regression Algorithmus verwendet wird?

A. Boolescher Typ

B. Clusterwert

C. Tisch

D. Skalarwert

35: Welche der folgenden Optionen ist der Parameter des Microsoft Time Series -Algorithmus, der zur Kontrolle des Wachstums eines Entscheidungsbaums verwendet wird?

A. Vorhersage_Smoothing

B. Procesast_method

C. Instability_sensitivität

D. Komplexität_Penalty

36: Welche der folgenden Aussagen ist richtig für das Not Null -Modellierungsflag, das im Microsoft Time Series -Algorithmus verwendet wird?

A. Es gilt für Mining -Modellspalten.

B. Es gilt für Bergbaustrukturspalten.

C. Es gilt sowohl für Spalten des Bergbaummodells als auch für Spalten der Bergbaustruktur.

D. Es gilt weder für Bergbau -Modellsäulen noch für Bergbaustruktursäulen.

37: Welche der folgenden Stichprobenmethoden wird eher für heterogene Einheiten des Universums als für homogene Einheiten verwendet und kann nur dann übernommen werden, wenn seine Bevölkerung bekannt ist?

A. Einfache zufällige Stichprobe

B. Geschichtete zufällige Stichprobe

C. Umfangreiche Probenahme f

D. Quotenstrichprobenerhebung

38: Welche der folgenden Aussagen ist falsch über Stichprobenmethoden?

A. Daten können in einer Stichprobenmethode schneller erfasst werden.

B. Eine Stichprobenmethode bietet der Einrichtung, um die Forschungsarbeiten bequem zu organisieren und auszuführen.

C. Es ist günstiger.

D. Für die Verwendung einer Stichprobenmethode ist kein spezialisiertes Wissen erforderlich.

39: Welche der folgenden Aussagen ist in Pandas nicht korrekt?

A. Es ist gut für tabellarische Daten mit heterogenen Spalten geeignet.

B. Nur gekennzeichnete Daten können in eine PANDAS -Datenstruktur aufgenommen werden.

C. Es ist für willkürliche Matrixdaten (homogen typisiert oder heterogen) mit Zeilen- und Säulenetiketten geeignet.

D. Bestellte und nicht ordnungsgemäße (nicht unbedingt F‌iXD-Frequenz) Zeitreihendaten können auch mit Pandas analysiert werden.

40: Welche der folgenden grundlegenden Maßnahmen zur Beurteilung der Qualität des Textabrufs repräsentiert den Prozentsatz der für eine Abfrage relevanten abgerufenen Dokumente?

A. Abrufen

B. F-Score

C. Präzision

D. Sowohl a als auch c

41: Welcher der folgenden Data Mining -Algorithmen wird auf eine Datenbank mit einer großen Anzahl von Transaktionen angewendet und lernt auch Assoziationsregeln?

A. K-Means

B. C45

C. Em

D. Apriori

42: Welche der folgenden Optionen müssen während der Arbeit in einer Pylab -Umgebung nicht importiert werden?

A. Matplotlib

B. Pandas

C. Numpy

D. Sowohl a als auch c

43: In welchem der folgenden Situationen wird in welchem der folgenden Situationen eine Gegenstände als geschlossen angesehen?

A. Wenn alle unmittelbaren Supersets die gleiche Unterstützung wie die Itemset haben.

B. Wenn keiner seiner unmittelbaren Untergruppen die gleiche Unterstützung wie die Itemset hat.

C. Wenn alle unmittelbaren Untergruppen die gleiche Unterstützung wie die Itemset haben.

D. Wenn keiner seiner unmittelbaren Supersets die gleiche Unterstützung wie die Itemset hat.

44: Es wird angegeben, dass A und B zwei unabhängige binomiale Variablen mit Parametern 3.114 bzw. 2,1/4 sind. Finden Sie P (A + B 21).

A. 1/1024

B. 1023/1024

C. 11512

D. 511/512

45: Das Modell der Wörter wird in welchem der folgenden Textminingprozesse verwendet?

A. Features Auswahl

B. Textvorverarbeitung

C. Features Generation

D. Sowohl A als auch B

46: Für eine Gruppe von 12 Schülern wird die Summe der Quadrate der Unterschiede in ihren Reihen für Wissenschaft und Mathematik als 60 angegeben. Auf der Grundlage der angegebenen Informationen. Ermitteln Sie den Wert des Rangkorrelationskoeffizienten.

A. 0,60

B. 0,79

C. 0,45

D. 0,82

47: Berechnung der Rangkorrelationskoeffizienten zwischen Umsatz und Ausgaben für einen Zeitraum von 12 Jahren. Der Rangunterschied für ein Jahr wurde fälschlicherweise als 9 anstelle von 7 angenommen, und als Ergebnis wurde der Wert des Rangkorrelationskoeffizienten mit 0,79 berechnet. Wenn der Fehler behoben wird, was ist dann der ungefähre korrekte Wert des Rangkorrelationskoeffizienten?

A. 0,88

B. 0,82

C. 0,95

D. 0,90

48: Welcher der folgenden Clustering-Algorithmen wird zur Aufteilung basierender auf Gitterbasis verwendet?

A. BIRKE

B. K-Means

C. STACHEL

D. Fcm

49: Es wird angegeben, dass es 15 Werte von Werten auf X und Y gibt, so dass der Korrelationskoeffizient 0,87 beträgt. Es wird auch angegeben, dass die Standardabweichung auf 5,60 beträgt. Was wird der ungefähre Standardfehler der Schätzung von y auf x sein?

A. 2.5

B. 2.8

C. 3.2

D. 3.4

50: Sam ist beliebt, weil er in 6 von 12 Schüssen ein Ziel erreicht hat, während John das gleiche Ziel in 8 von 14 Schüssen erreichen kann. Wie wird die Wahrscheinlichkeit sein, dass das Ziel getroffen wird, wenn sie beide versuchen?

A. 11/14

B. 13/14

C. 1/14

D. 3/14

51: Welches der folgenden Abtastmethoden ist eine Nicht-Wahrscheinlichkeit?

A. Urteilsabtastung

B. Geschichtete zufällige Stichprobe

C. Cluster -Stichprobe

D. Mehrständige zufällige Stichprobe

52: Welche der folgenden Aussagen sind nicht korrekt über das Bayesian Glaubensnetzwerk?

A. L1 In einem Glaubensnetzwerk kann die klassenbedingte Unabhängigkeit zwischen den Untergruppen von Variablen definiert werden.

B. VJ Joint Conditionalwahrscheinlichkeitsverteilung kann nicht von Bayes'schen Glaubensnetzwerken spezifiziert werden.

C. VJ Ein ausgebildetes Bayes'sche Netzwerk kann nicht zur Klassifizierung verwendet werden.

D. VJ Ein grafisches Modell der lässigen Beziehung zur Durchführung von Lernen wird vom Bayesian Glaubensnetzwerk bereitgestellt.

53: Welche der folgenden Aussagen ist richtig für die Beurteilungsstichprobenmethode?

A. In dieser Methode besteht keine Möglichkeit von persönlichen Vorurteilen.

B. Es ist genauer und zuverlässig.

C. Es wird hauptsächlich in diesen Feldern verwendet, in denen fast ähnliche Einheiten existieren oder einige Einheiten zu wichtig sind, um aus der Stichprobe ausgeschlossen zu werden.

D. Es ist sehr teuer.

54: Welche der folgenden Darstellungen der gemeinsamen Dichte von (6, x) ist im baysischen Modell die korrekte Darstellung der gemeinsamen Dichte von (6, x).

A. n (xl0) p (x)

B. n (0) p (x)

C. n (0) p (xl0)

D. nl (x) p (0lx)

55:
Welche der folgenden Befehle wird verwendet, um die Art und Weise zu beobachten, wie ein R -Objekt strukturiert ist? Es wird angegeben, dass MyData eine Variable ist, in der die Daten eines Benutzers gespeichert werden.

A. Bibliothek (mydata)

B. beschreiben (mydata)

C. str (mydata)

D. Zusammenfassung (mydata)

56: In welchem der folgenden Big -Data -Technologien, die relevante Datenverwaltung, Analyse- und Berichtsaufgaben auf die Stelle, an der sich die Daten befinden, verschieben, verbessert die Geschwindigkeit für Einblicke, reduziert die Datenbewegung und fördert eine bessere Datenregierungsführung?

A. Unterstützung für Hadoop

B. LN-Memory-Analytik

C. Raster Computing

D. LN-DATABASE-Verarbeitung

57: Welche der folgenden Befehle wird zum Starten der Ipython -Schnittstelle im Inline -Pylab -Modus und zum Öffnen von Ipython -Notebook in der Pylab -Umgebung verwendet?

A. ipython - pylab = in | Ine

B. ipython -pylab = inline -notebook

C. ipython = Notebook - pylab.in | Ine

D. Ipython Notebook - pylab = inline

58: LN Data Mining, nach Bayes -Theorem, welche der folgenden Formeln repräsentiert die hintere Wahrscheinlichkeit in Bezug auf frühere Wahrscheinlichkeit?

A. P (x/h) = p (h/x) p (h)/p (x)

B. P (h/x) = p (x/h) p (h)/p (x)

C. P (h/x) = p (x/h) p (x)/p (h)

D. P (xih) = p (h/x)/p (h) p (x)

59: Welche der folgenden Aussagen ist im Data Mining nicht korrekt für den C45 -Algorithmus?

A. Es ermöglicht nur ein Ergebnis.

B. Ein Einzelpassalgorithmus, der aus binomialen Konf‌idenzgrenzen abgeleitet ist, wird von C45 verwendet.

C. Es verwendet informationsbasierte Kriterien.

60: Wenn ein Benutzer die Top -Keywords kennenlernen möchte, die Menschenhandel an seine Website senden, welche der folgenden Akquisitionssegmentierungen sollte dann bevorzugt werden?

A. Überweisungenhandel

B. Bio -Menschenhandel

C. Direkten Verkehr

D. Sozialhandel

61: Welche der folgenden Analysen sollte im Google Analytics -Tool durchgeführt werden, um den Ursprung des Webhandels eines Benutzers zu identifizieren?

A. Erfassungsanalyse

B. Publikumsanalyse

C. Verhaltensanalyse

D. Konversionsanalyse

62: Welche der folgenden Arten von Assoziationsabbau entdeckt Subsequenzen, die mehr als die Minsup -Sequenzen in einer Sequenzdatenbank sind?

A. Sequentielle Regeln

B. Verallgemeinerte Verbandsregeln

C. Sequentielle Musterabbau

D. Warmr

63: Welche der folgenden Faktoren ist für das Auftreten von Stichprobenfehlern verantwortlich?

A. Fehler aufgrund falscher statistischer Maßnahmen.

B. Fehler in der Zusammenstellung.

C. Rahmung eines falschen Fragebogens.

D. Fehlerhafte Abgrenzung von Stichprobeneinheiten.

64: Welche der folgenden Syntaxe für die Definition des Rückrufs ist im Data -Mining, der zur Beurteilung der Qualität des Textabrufs verwendet wird?

A. Relast = l [relevant} u [abgerufen] l l l [relevant}!

B. Relast = l [relevant} u [abgerufen] | l l {abgerufen] l

C. Relast = l [relevant} f‌l {abgerufen} | / l [abgerufen] l

D. Rückruf = l [relevant} n [abgerufen} l / l [relevantji

65: Welche der folgenden Aussagen ist die korrekte R -Syntax, die zur Auswahl bestimmter Zeilen aus einem Datenrahmen verwendet wird, basierend auf spezifischen logischen Kriterien?

A. Wählen Sie (DataFramename, logischer Ausdruck)

B. f‌ilter (logischer Ausdruck, Datenframnahneame)

C. f‌ilter (DataFramename, logischer Ausdruck)

D. Wählen Sie (logischer Ausdruck, DataFramenname)

66: Welche der folgenden Methoden wird in der Überlebensanalyse verwendet, um die Gefährdungsfunktion auf einem Satz von Prädiktorvariablen zu modellieren?

A. Surv ()

B. Coxph ()

C. SURDDIFF ()

D. überlistet ()

67: Welche der folgenden Aussagen ist eine beschreibende Funktion, die am Data Mining beteiligt ist?

A. Evolutionsanalyse

B. Vorhersage

C. Ausreißeranalyse

D. Assoziationsabbau

68: Welche der folgenden Aussagen ist nicht korrekt für die Datenwissenschaft?

A. Es wird zum Umwandeln von Daten in Aktionen verwendet.

B. Es unterstützt und fördert das Verschieben zwischen deduktivem und induktivem Denken.

C. Um Erfolg zu erzielen. Organisationen müssen maximale Data Science -Reife erreichen.

D. Es ist notwendig, dass Unternehmen beim Paket bleiben und in Zukunft antreten.

69: Welcher der folgenden Clustering -Algorithmen kann laute Daten verarbeiten?

A. HEILUNG

B. FELSEN

C. BIRKE

D. Chamäleon

70: Welche der folgenden Aussagen ist richtig für den abfragebedingten Ansatz von Data Warehousing?

A. Für diesen Ansatz sind komplexe Integrations- und Verfasserprozesse erforderlich.

B. Mit diesem Ansatz können die Daten kopiert werden. verarbeitet. integriert. Annotiert. In einem semantischen Datenspeicher im Voraus zusammengefasst und umstrukturiert.

C. Es ist sehr wirtschaftlich für Fragen, die Aggregationen erfordern.

D. Es ist für häufige Fragen wesentlich effizienter.

71: Es wird angegeben, dass y eine Poisson ist, die die Bedingung P (y = 4) = P (y = 5) variiert und erfüllt. Was sind die Werte von Mittelwert und Standardabweichung von Y?

A. Mittelwert = 3 und Standardabweichung = /5

B. Mittelwert = 5 und Standardabweichung = /3

C. Mittelwert = 5 und Standardabweichung = /’5

D. Mittelwert = 7 und Standardabweichung = /7

72: Mit welcher der folgenden Funktionen wird eine Zeitreihe mit additivem Trend sowie saisonale und unregelmäßige Komponenten zerlegt?

A. stl0

B. tso

C. ETSO

D. Arimao

73: Welche der folgenden Modelle werden im Data Mining verwendet, um die kategorialen Klassenbezeichnungen vorherzusagen?

A. Klassifisches Modell

B. Vorhersagemodell

C. Sowohl A als auch B

D. Weder A noch B

74: In welcher der Schlüsseltechnologien, die zum Extrahieren des Geschäftswerts aus Big Data verwendet werden, werden Daten als strategisch verwaltet. Kernvermögen mit fortlaufender Prozesskontrolle für Big Data Analytics?

A. Informationsmanagement für Big Data

B. Hochleistungsanalyse für Big Data

C. Flexible Bereitstellungsoptionen für Big Data

75: In der Assoziationsregel -Mining wird ein Hinweis darauf, wie oft die Regel als wahr befunden wurde, durch einen Begriff, der als Vertrauen bekannt ist. Wie ist dieser Begriff? Vertrauen. für die Regel dargestellt, a => b?

A. conf (a => b) = Supp (a u b) / upp (a)

B. conf (a => b) = Supp (b) / Supp (a)

C. conf (a => b) = Supp (a u b) / Supp (a) „Supp (b)

D. conf (a => b) = Supp (a u b) / 1 - Supp (a)

76: Für einen bestimmten Satz von 25 Elementen beträgt der Korrelationskoeffizient zwischen x und y 0,6. Die Werte des arithmetischen Mittelwerts von x und y betragen 14 bzw. 18, und die Werte der Standardabweichung von x und y sind 4 bzw. 6. Wenn das Paar (25. 18) fälschlicherweise als (18, 25) genommen wurde. Finden Sie dann den korrekten Wert des Korrelationskoeffizienten.

A. 0,31

B. 0,42

C. 0,51

D. 0,67

77: Welche der folgenden Möglichkeiten ist die korrekte Art, Nullhypothese des unteren Schwanztests des Bevölkerungsmittels auszudrücken? Es wird angegeben, dass UO eine hypothetische Untergrenze des wahren Bevölkerungswerts ist

A. up 5 ll

B. P0 = l1

C. po 2 p

78: Welche der folgenden Teile eines Entscheidungsbaums repräsentiert im Data Mining das Ergebnis eines Tests?

A. Ein interner Knoten

B. Ein Blattknoten

C. Ein Zweig

D. Der oberste Knoten

79: Welche der folgenden Aussagen ist/sind korrekt für einen SAS -Unterscheidungsmerkmal?

A. Es bietet starken Architekturansatz.

B. Es kann jeweils nur ein Modell verwalten und nutzen.

C. Es ist einzigartig positioniert, um Unternehmen dabei zu helfen, Big Data und Big Data Analytics in den Geschäftswert zu verwandeln.

D. Beide Optionen A und C sind korrekt.

80: Welche der folgenden Angaben ist bei der Klassifikation von Daten korrekt?

A. Es gibt Daten in präziser und kondensierter Form.

B. LL statistische Analyse ist für alle Arten von Daten mit Ausnahme klassifizierter Daten möglich.

C. Ii] Es erlaubt keinen Vergleich zwischen verschiedenen Merkmalen.

D. Es macht Daten leichter verständlich, indem sie unnötige Details beseitigen.

81: Welche Funktion der folgenden Methode ist in der linearen Diskriminanzfunktion der Diskriminanzfunktionsanalyse?

A. Es erzeugt jacknibles Vorhersagen.

B. Es wird verwendet, um die quadratische Diskriminanzfunktion zu erhalten.

C. Es druckt Diskriminanzfunktionen basierend auf Variablen, die zentriert, aber nicht standardisiert sind.

D. Es kann die Ergebnisse einer linearen oder quadratischen Klassifizierung mit zwei Variablen gleichzeitig anzeigen.

82: Welche der folgenden Klassifizierungsmodelle wird im Data Mining vom KNN -Algorithmus erstellt?

A. Entscheidungsbaumklassifizierungsmodell

B. Ensemble -Klassifizierungsmodell

C. Hyperplane -Klassifizierungsmodell

D. Kein Klassifizierungsmodell wird von KNN gebaut

83: Welche der folgenden Aussagen ist im Data -Mining die richtige Syntax der Folienmethode, Foil_prune, die für eine Regel für eine Regel R verwendet wird? Es wird angegeben, dass P die Anzahl der durch R bedeckten positiven Tupel ist und N die Anzahl der von R bedeckten negativen Tupel ist

A. Foil_prune = p - n/p + n

B. Foil_prune = p + n/p - n

C. Foil_prune = p/n

D. Foil_prune = n/p + n

84: In Hypothesentests. Wie nennen Sie eine Bevölkerung, deren Daten kategorisch sind und zu einer Sammlung diskreter nicht überlappender Klassen gehört?

A. Monomial

B. Binomial

C. Trinom

D. Multinomial

85: Welche der folgenden T-Tests sollten durchgeführt werden, um Mittelwerte aus zwei verschiedenen Gruppen zu vergleichen?

A. Eine Probe t - Test

B. Gepaarte Proben t - Test

C. Unabhängige Proben T-Test

D. Varianzanalyse (ANOVA)

86: Welche der folgenden Aussagen ist in der Assoziationsregel-Mining für die häufige Erzeugung des zweistufigen Ansatzes korrekt?

A. Generiert nur eine Elementset, deren Unterstützung 2 Minsup

B. Generiert alle Itemsets, deren Unterstützung 5 Minsup

C. Generiert alle Itemsets, deren Unterstützung 5 Minsup

D. Generiert hohe Vertrauensregeln aus jeder häufigen Elementset

87: Ein Benutzer kann die Seitenaufrufe einer Website mit Hilfe der folgenden Webanalyseziele erhalten?

A. Seiten/Sitzungsziel

B. Dauerziel

C. Zielziel

D. Ereignisziele

88: Wenn es einige Daten mit fehlenden Werten gibt und Sie eine Hilfe einer Funktion lesen müssen, sagen Sie Median, welche der folgenden Richtungen ist dann die richtige R -Syntax, um dies zu tun?

A. ?Median

B. Read.Median0

C. #Median

D. Hilfe.Median0

89: Welche der folgenden Metriken wird in der Webanalyse im E -Commerce -Dashboard überwacht?

A. Seite Ladezeit nach Browser

B. Gesamtverkauf durch Produkte

C. Konvertierung nach Blog -Beitrag

D. Quelle in Echtzeithandel

90: Ein parametrisches statistisches Modell ist gegeben als: (s, p) mit P = [p6: e e 9]. Welche der folgenden Methoden ist basierend auf statistischen Notationen die richtige Methode zur Darstellung von A?

A. e g r 0d

B. a = r2d

C. O C 2dr

D. a e drz

91: Wenn der Signifikationsniveau eines Tests 5%beträgt, wie hoch ist das Ergebnis des Tests, wenn der erhaltene p-Wert größer als 0,05 ist?

A. Nullhypothese ablehnen

B. Nullhypothese nicht ablehnen

C. Die Akzeptanz oder Ablehnung der Nullhypothese ist unabhängig vom p-Wert.

92: Welcher der folgenden Aussagen ist der Standardwert des Parameters hlstorlcal_model_gap, der im Microsoft -Zeitreihenalgorithmus verwendet wird?

A. 10

B. 1

C. 0

D. 5

93: Welche der folgenden DMQL-Syntaxe wird zum Angeben von aufgabenrelevanten Daten verwendet?

A. Verwenden Sie die Datenbankdatenbank_name

B. Verwenden Sie Data Warehouse Data_warehouse_Name

C. Database.UseDatabase_name

D. DataWareHouse.USEDATA_WAREHOUSE_NAME

94: _______ reduziert die Anzahl der Bits in einer Datei, indem sie Redundanz identifiziert und beseitigt

A. Verlustfreie Kompression

B. Verlustige Komprimierung

C. Bitmap

D. Datenvisualisierung

95: Datentypen, die vom Programmierer erstellt werden, werden als ________ bezeichnet.

A. Variablen

B. Abstrakte Datentypen (ADTs)

C. Funktionen

D. Parameter

E. Keine von diesen

96: Diigo und lecker sind ________ Werkzeuge.

A. Soziales Lesezeichen

B. Forschung

C. Diskussionsgruppe

D. Synchrone Kommunikation

97: Schmutzige Daten sind ________.

A. Virus infizierte Daten

B. Wurm-infizierte Daten

C. Ungenaue, unvollständige Daten

D. Gestohlene Daten

98: Das ______ eines Arbeitsblatts definiert sein Erscheinungsbild.

A. Form

B. Format

C. Sicht

D. Aufzeichnen

99: ____ Fallwerkzeuge unterstützen die Codierung und Implementierungsphasen.

A. Horizontal

B. Frontend

C. Back-End

D. Vertikal

100: ________ Tools und Techniken verarbeiten Daten und führen statistische Analysen für Einsichten und Entdeckungen durch.

A. Enterprise Data Governance

B. Proprietäre Informationssysteme

C. Business Intelligence

D. Arbeitsprozesse

Fragen zur Datenanalyse in deutscher Sprache

Fragen zur Datenanalyse in deutscher Sprache

1: Welche der folgenden Arten von Zeitreihenanalysen zielt darauf ab, periodische oder zyklische Komponenten in einer Zeitreihe zu trennen?

2: Welche der folgenden Optionen repräsentieren (en) die korrekte Anwendung des Assoziationsregel -Mining?

3: Welche der folgenden Optionen ist/sind die richtigen Anwendungen des Textminens?

4: In Bezug auf Microsoft Neural Network Algorithmus. Welche der folgenden Optionen ist der Neuronentyp, der vorhersehbare Attributwerte für ein Data Mining -Modell darstellt?

5: Welche der folgenden Optionen ist/sind korrekt für den Microsoft Naive Bayes -Algorithmus?

6: Welche der folgenden Optionen ist für die logistische Regressionstechnik korrekt?

7: Welche der folgenden Optionen ist im Data Mining für den Regressionsalgorithmus richtig?

8: Gemäß dem Microsoft Association Rules -Modell. Welche der folgenden Optionen ist die Registerkarte Richtiger Zuschauer, die Informationen zu ElementsSets und ihrem relativen Wert kombiniert?

9: Welche der folgenden Aussagen ist für den Typ der Interventionsanalyse der Zeitreihenanalyse korrekt?

10: Welche der folgenden Aussagen ist der korrekte Standardwert des Parameters maximum_itemset_size, der mit dem Microsoft Association Rules -Algorithmus verwendet wird?

11: Welche der folgenden Optionen ist in Bezug auf fortschrittliche Statistiken die richtige Syntax der GLM () -Funktion?

12: Welche der folgenden Aussagen ist die korrekte Syntax des Befehls, die die Installation des XLSX -Pakets überprüfen und die Bibliothek in den R -Arbeitsbereich lädt?

13: Welche der folgenden Text -Mining -Techniken kann verwendet werden, um Gruppen von Dokumenten mit ähnlichem Inhalt zu erfassen?

14: Welche der folgenden Algorithmus -Typen prognostiziert im SOL Server Data Mining eine oder mehrere diskrete Variablen, die auf anderen Attributen in einem Datensatz basieren?

15: Welche der folgenden Optionen ist im Data Mining die richtige Syntax für die Assoziation?

16: Welche der folgenden Regressionstechniken versucht, die Vorhersageleistung mit minimaler Anzahl von Prädiktorvariablen zu maximieren?

17: Welche der folgenden Aussagen ist richtig für die vorhersehbare Spalte, die vom Microsoft Linear Regressionsalgorithmus unterstützt wird?

18: Welche der folgenden Aussagen ist richtig für den Parameter Prediction_Smoothing, der im Microsoft Time Sery -Algorithmus verwendet wird?

19: Welche der folgenden Aussagen ist der korrekte Standardwert für den Parameter Instability_sensitivity, der mit dem Microsoft Time -Series -Algorithmus verwendet wird?

20: Welche der folgenden Optionen ist in Bezug auf fortschrittliche Statistiken in Bezug auf die Arimao -Funktion korrekt?

21: Welche der folgenden Optionen ist im Data Mining für die F-Score-Maßnahme für das Abrufen von Text korrekt?

22: Welche der folgenden Aussagen ist der Standardwert des Parameter Historical_Model_GAP, der im Microsoft -Zeitreihenalgorithmus verwendet wird?

23: Welche der folgenden erweiterten Statistiktechniken wird zur Identifizierung latenter Variablen verwendet, die Gruppen bilden?

24: Welche der folgenden Optionen hat in der Data Mining die Präzision korrekt definiert, die zur Beurteilung der Qualität des Textabrufs verwendet werden?

25: Welche der folgenden Maßnahmen zur Abrufen von Text ist der Prozentsatz der Dokumente, die für die Abfrage relevant sind und tatsächlich abgerufen wurden?

26: Welcher der folgenden Aussagen ist der korrekte Standardwert des Parameters von Holdout_percentage des Microsoft Logistic Regressionsalgorithmus, der zum Angeben des Prozentsatzes der Fälle innerhalb der Trainingsdaten verwendet wird, die zur Berechnung eines Holdout -Fehlers verwendet werden?

27: Welche der folgenden Aussagen ist in fortgeschrittenen Statistiken über die Dirichlet -Regressionsmethode korrekt?

28: In welcher der folgenden Textmining -Methoden werden Begriffe auf Satz- und Dokumentebene analysiert?

29: In fortgeschrittenen Statistiken. Welche der folgenden Regressionsmethoden wird verwendet, um Variablen innerhalb des Bereichs (0, 1) zu modellieren?

30: Welche der folgenden Parameter enthält gemäß dem Microsoft Association Rules -Algorithmus die Mindestanzahl von Fällen, die eine Elementen enthalten müssen, bevor der Algorithmus eine Regel generiert?

31: Welche der folgenden Linksfunktionen für die Gaußsche Familie lautet gemäß Advanced Statistics Generalized Linearmodell?

32: Welche der folgenden Optionen ist laut Microsoft Association Rules -Algorithmus die Vorhersagefunktion mit dem Skalarwert als Rückgabeart?

33: Welche der folgenden Optionen ist der Standard -Clustering_Method, der vom Microsoft -Clustering -Algorithmus verwendet wird?

34: Welche der folgenden Optionen ist der korrekte Rückgabetyp der Vorhersagefunktion des PredicThistogram (DMX), die vom Microsoft Logistic Regression Algorithmus verwendet wird?

35: Welche der folgenden Optionen ist der Parameter des Microsoft Time Series -Algorithmus, der zur Kontrolle des Wachstums eines Entscheidungsbaums verwendet wird?

36: Welche der folgenden Aussagen ist richtig für das Not Null -Modellierungsflag, das im Microsoft Time Series -Algorithmus verwendet wird?

37: Welche der folgenden Stichprobenmethoden wird eher für heterogene Einheiten des Universums als für homogene Einheiten verwendet und kann nur dann übernommen werden, wenn seine Bevölkerung bekannt ist?

38: Welche der folgenden Aussagen ist falsch über Stichprobenmethoden?

39: Welche der folgenden Aussagen ist in Pandas nicht korrekt?

40: Welche der folgenden grundlegenden Maßnahmen zur Beurteilung der Qualität des Textabrufs repräsentiert den Prozentsatz der für eine Abfrage relevanten abgerufenen Dokumente?

41: Welcher der folgenden Data Mining -Algorithmen wird auf eine Datenbank mit einer großen Anzahl von Transaktionen angewendet und lernt auch Assoziationsregeln?

42: Welche der folgenden Optionen müssen während der Arbeit in einer Pylab -Umgebung nicht importiert werden?

43: In welchem ​​der folgenden Situationen wird in welchem ​​der folgenden Situationen eine Gegenstände als geschlossen angesehen?

44: Es wird angegeben, dass A und B zwei unabhängige binomiale Variablen mit Parametern 3.114 bzw. 2,1/4 sind. Finden Sie P (A + B 21).

45: Das Modell der Wörter wird in welchem ​​der folgenden Textminingprozesse verwendet?

46: Für eine Gruppe von 12 Schülern wird die Summe der Quadrate der Unterschiede in ihren Reihen für Wissenschaft und Mathematik als 60 angegeben. Auf der Grundlage der angegebenen Informationen. Ermitteln Sie den Wert des Rangkorrelationskoeffizienten.

48: Welcher der folgenden Clustering-Algorithmen wird zur Aufteilung basierender auf Gitterbasis verwendet?

49: Es wird angegeben, dass es 15 Werte von Werten auf X und Y gibt, so dass der Korrelationskoeffizient 0,87 beträgt. Es wird auch angegeben, dass die Standardabweichung auf 5,60 beträgt. Was wird der ungefähre Standardfehler der Schätzung von y auf x sein?

50: Sam ist beliebt, weil er in 6 von 12 Schüssen ein Ziel erreicht hat, während John das gleiche Ziel in 8 von 14 Schüssen erreichen kann. Wie wird die Wahrscheinlichkeit sein, dass das Ziel getroffen wird, wenn sie beide versuchen?

51: Welches der folgenden Abtastmethoden ist eine Nicht-Wahrscheinlichkeit?

52: Welche der folgenden Aussagen sind nicht korrekt über das Bayesian Glaubensnetzwerk?

53: Welche der folgenden Aussagen ist richtig für die Beurteilungsstichprobenmethode?

54: Welche der folgenden Darstellungen der gemeinsamen Dichte von (6, x) ist im baysischen Modell die korrekte Darstellung der gemeinsamen Dichte von (6, x).

55: Welche der folgenden Befehle wird verwendet, um die Art und Weise zu beobachten, wie ein R -Objekt strukturiert ist? Es wird angegeben, dass MyData eine Variable ist, in der die Daten eines Benutzers gespeichert werden.

57: Welche der folgenden Befehle wird zum Starten der Ipython -Schnittstelle im Inline -Pylab -Modus und zum Öffnen von Ipython -Notebook in der Pylab -Umgebung verwendet?

58: LN Data Mining, nach Bayes -Theorem, welche der folgenden Formeln repräsentiert die hintere Wahrscheinlichkeit in Bezug auf frühere Wahrscheinlichkeit?

59: Welche der folgenden Aussagen ist im Data Mining nicht korrekt für den C45 -Algorithmus?

60: Wenn ein Benutzer die Top -Keywords kennenlernen möchte, die Menschenhandel an seine Website senden, welche der folgenden Akquisitionssegmentierungen sollte dann bevorzugt werden?

61: Welche der folgenden Analysen sollte im Google Analytics -Tool durchgeführt werden, um den Ursprung des Webhandels eines Benutzers zu identifizieren?

62: Welche der folgenden Arten von Assoziationsabbau entdeckt Subsequenzen, die mehr als die Minsup -Sequenzen in einer Sequenzdatenbank sind?

63: Welche der folgenden Faktoren ist für das Auftreten von Stichprobenfehlern verantwortlich?

64: Welche der folgenden Syntaxe für die Definition des Rückrufs ist im Data -Mining, der zur Beurteilung der Qualität des Textabrufs verwendet wird?

65: Welche der folgenden Aussagen ist die korrekte R -Syntax, die zur Auswahl bestimmter Zeilen aus einem Datenrahmen verwendet wird, basierend auf spezifischen logischen Kriterien?

66: Welche der folgenden Methoden wird in der Überlebensanalyse verwendet, um die Gefährdungsfunktion auf einem Satz von Prädiktorvariablen zu modellieren?

67: Welche der folgenden Aussagen ist eine beschreibende Funktion, die am Data Mining beteiligt ist?

68: Welche der folgenden Aussagen ist nicht korrekt für die Datenwissenschaft?

69: Welcher der folgenden Clustering -Algorithmen kann laute Daten verarbeiten?

70: Welche der folgenden Aussagen ist richtig für den abfragebedingten Ansatz von Data Warehousing?

71: Es wird angegeben, dass y eine Poisson ist, die die Bedingung P (y = 4) = P (y = 5) variiert und erfüllt. Was sind die Werte von Mittelwert und Standardabweichung von Y?

72: Mit welcher der folgenden Funktionen wird eine Zeitreihe mit additivem Trend sowie saisonale und unregelmäßige Komponenten zerlegt?

73: Welche der folgenden Modelle werden im Data Mining verwendet, um die kategorialen Klassenbezeichnungen vorherzusagen?

74: In welcher der Schlüsseltechnologien, die zum Extrahieren des Geschäftswerts aus Big Data verwendet werden, werden Daten als strategisch verwaltet. Kernvermögen mit fortlaufender Prozesskontrolle für Big Data Analytics?

75: In der Assoziationsregel -Mining wird ein Hinweis darauf, wie oft die Regel als wahr befunden wurde, durch einen Begriff, der als Vertrauen bekannt ist. Wie ist dieser Begriff? Vertrauen. für die Regel dargestellt, a => b?

77: Welche der folgenden Möglichkeiten ist die korrekte Art, Nullhypothese des unteren Schwanztests des Bevölkerungsmittels auszudrücken? Es wird angegeben, dass UO eine hypothetische Untergrenze des wahren Bevölkerungswerts ist

78: Welche der folgenden Teile eines Entscheidungsbaums repräsentiert im Data Mining das Ergebnis eines Tests?

79: Welche der folgenden Aussagen ist/sind korrekt für einen SAS -Unterscheidungsmerkmal?

80: Welche der folgenden Angaben ist bei der Klassifikation von Daten korrekt?

81: Welche Funktion der folgenden Methode ist in der linearen Diskriminanzfunktion der Diskriminanzfunktionsanalyse?

43: In welchem der folgenden Situationen wird in welchem der folgenden Situationen eine Gegenstände als geschlossen angesehen?

45: Das Modell der Wörter wird in welchem der folgenden Textminingprozesse verwendet?

55:
Welche der folgenden Befehle wird verwendet, um die Art und Weise zu beobachten, wie ein R -Objekt strukturiert ist? Es wird angegeben, dass MyData eine Variable ist, in der die Daten eines Benutzers gespeichert werden.