Diese Multiple-Choice-Fragen und -Antworten zum Data Mining helfen Ihnen, Data Mining-Themen besser zu verstehen. Bereiten Sie sich mit diesen über 100 MCQ-Datensammlungen auf Ihre nächste Prüfung oder Ihr nächstes Vorstellungsgespräch vor.
Scrollen Sie nach unten, um mit der Antwort zu beginnen.
A. Alle von denen
B. Einzelhandel
C. Herstellung
D. Finanzen/Bankgeschäfte
A. Ausgangsschicht
B. Versteckte Schicht
C. Transparente Schicht
D. Eingangsschicht
A. inkonsistent
B. schmutzig
C. nicht integriert
D. körnig
A. Der Bereich der Variablen in einem Satz
B. Die Anzahl der verwendeten Knoten
C. Die grafische Visualisierung der Daten
D. Die Anzahl der Schichten und die Anzahl der Knoten in jeder Schicht
A. Einzelne Verbindung
B. DSBSCAN
C. Beide
D. Keine von diesen
A. FALSCH
B. WAHR
A. Chaid
B. künstlich
C. Beschneidung
D. assoziativ
A. & lt; Body Antwort = " gültig " & gt; dieses eine & lt;/body & gt;
B. & lt; gültig & gt; dieses eine & lt;/gültig & gt;
C. & lt; gültig & gt; " dieses eine " & lt;/gültig & gt;
D. Alle sind gültig
A. Alles das oben Genannte
B. Apache Cassandra
C. Google Big Table
D. MongoDb
A. Der technische Begriff für den Datenakt von Daten, die auf einem Server gespeichert werden
B. Eine strukturierte und entwickelte Vorhersage von Datenergebnissen
C. Die visuelle Interpretation komplexer Beziehungen in mehrdimensionalen Daten
A. Differentielle Entschlüsselung
B. Knoop-Hartness gemessen durch hochwirksame Dimension
C. Wissensentdeckung in Datenbanken
D. K-Mean-Datenentdeckung
A. Alle sind gültige Typen
B. Neurales Netzwerk
C. Statistisch
D. Maschinelles Lernen
A. FALSCH
B. WAHR
A. Alles das oben Genannte
B. Künstliche Intelligenz
C. Statistiken
D. Linguistik
A. Abhängig
B. Alle von denen
C. Antwort
D. Zielvariablen
A. Klassifizierung
B. Regression
C. Segmentierung
A. Vorhersehbare Sets
B. Mitteilende Organisationen
C. Fitgrade
D. Cluster
A. Komplexe Berichte, die von einem qualifizierten Datenwissenschaftler erstellt wurden
B. Hierarchische Dimensionen, die mit einem Hyper -Würfelbrowser erstellt werden können
C. Daten, die nicht von der Organisation gesammelt wurden, z. B. Daten, die aus einem Nachschlagewerk verfügbar sind
D. Strukturen, die Regeln für die Klassifizierung eines Datensatzes generieren
A. Relationale Lernmodelle
B. Entscheidungsbäume und Regeln
C. Alle von denen
D. Probabilistische grafische Abhängigkeitsmodelle
A. FALSCH
B. WAHR
A. Ein Entscheidungsbaum, der in den 1980er Jahren entwickelt wurde, aber heute fast ausschließlich durch die CART -Methode ersetzt wurde
B. Eine sechs Phasenmethode zur Vorhersage von E-Commerce-Kaufgewohnheiten
C. Microsoft linearer Regressionsalgorithmus
D. Ein branchenübergreifender Standardprozess für Data Mining
A. Vorgezogen
B. Aktivierungsfunktion
C. Verwirrung Matrix
D. Chi-Quadrat
A. WAHR
B. FALSCH
A. Binäre Standardabweichung
B. Kovarianz
C. Polykonvergenz
D. Stochastische Trägheit
A. Nutzung von Geschäftserfahrungen und Darminstinkt, um einen neuen Grundriss in einem Lebensmittelgeschäft zu entwerfen
B. Umstrukturierung der Startaufstellung Ihres Basketballteams basierend auf einer Leistungsanalyse
C. Zwei häufig gekaufte Artikel nebeneinander im Regal platzieren
D. Vorhersage der Wahrscheinlichkeit, dass ein Rucksack auf der Grundlage des Kaufs von Schlafsäcken und Wanderschuhen durch den Verbraucher gekauft wird
A. Segmentierung
B. Einstufung
C. Regression
A. Eine intuitive und benutzerfreundliche Benutzeroberfläche
B. Firewalls eingerichtet, um Daten vor böswilligen Quellen zu schützen
C. Die Hardware, die speziell für die Speicherung von massiven Datenmengen entwickelt wurde
D. Das Programm von Programmierern, die die in einem bestimmten Bergbauprojekt verwendete Software entwickelt haben
A. Entscheidungsgrenze trennende Datenklassen
B. Variante des C4.5 -Algorithmus
C. Sammlung von verknüpften Hypertextdateien
D. Nicht terminierende Fehlerbedingung
A. Overlay
B. Übertreffen
C. Lärm
D. Nicht anwendbares Datum
A. Preis
B. Wirtschaftliche Abschwung
C. Personalfähigkeiten
D. Produktplatzierung
A. Sequentielle Strukturierung
B. Clustering
C. Klassifizierung
D. Gamification
A. Strukturelle Ebene
B. Qualitative Ebene
C. Grundstufe
D. Quantitativer Ebene
A. Verringern Sie die Größe des Trainingsdatensatzes
B. Erhöhen Sie die Größe des Trainingsdatensatzes
C. Erhöhen Sie die Größe des Testdatensatzes
D. Verringern Sie die Größe des Testdatensatzes
A. Adaboost
B. Die Binsseitenmethode
C. Googlecrawler
D. Seitenrang
A. Der Vorgänger ist immer eine sehr komplexe Variable
B. Nichts, sie sind austauschbar
C. Der Vorgänger liegt rechts, die Konsequenz ist links.
D. Der Vorgänger liegt links, die Konsequenz nach rechts
A. teilweise Durchschnitt
B. unvoreingenommener Mittel
C. zusammengestoßen
D. gleitender Durchschnitt
A. Erlernen einer Funktion, die ein Datenelement in eine von mehreren vordefinierten Gruppen abbildet.
B. Ein Ausdruck E in einer Sprache l, die Fakten in einer Untergruppe von F von F beschreibt.
C. Eine beschreibende Aufgabe, bei der man versucht, eine endliche Reihe von Kategorien zu identifizieren, um die Daten zu beschreiben.
D. Erlernen einer Funktion, die ein Datenelement einer realwerten Vorhersagevariablen ordnet.
A. Ein mehrstufiger Prozess, der Datenvorbereitung, Mustersuche, Wissensbewertung und Verfeinerung der Iteration nach der Änderung beinhaltet.
B. Lernen Sie eine Funktion, die ein Datenelement in eine von mehreren vordefinierten Gruppen oder Clustern abbildet.
C. Der Prozess des Auffindens eines Modells, das signifikante Abhängigkeiten zwischen Variablen beschreibt
D. Eine Aufgabe, die aus Techniken zur Schätzung der Daten aus Daten der gemeinsamen Multi-Variate-Wahrscheinlichkeitsdichtefunktion aller Variablen/Felder in der Datenbank besteht.
A. Versteckt
B. Eingang
C. Ausgang
D. Funktional
A. Ein Maß für das Rauschen in einem Datenbankinhalt
B. Parionierung einer Datenbank für die Verteilung über verschiedene Server
C. gleichzeitig auf mehrere Objektdatenbanken über SSH zugreifen
D. nichts des oben Genannten
A. Eine Aufgabe, die sich darauf konzentriert, die bedeutendsten Änderungen in den Daten aus zuvor gemessenen oder normativen Werten zu ermitteln
B. Methoden zum Suche nach einer kompakten Beschreibung für eine Teilmenge von Daten.
C. Der Prozess des Auffindens eines Modells, das signifikante Abhängigkeiten zwischen Variablen beschreibt
D. Eine Aufgabe, die aus Techniken zur Schätzung der Daten aus Daten der gemeinsamen Multi-Variate-Wahrscheinlichkeitsdichtefunktion aller Variablen/Felder in der Datenbank besteht.
A. Fuzzy Logic
B. Assoziationslernen
C. Anomalieerkennung
D. Clustering -Algorithmen
A. Eingeschränkte Boltzmann -Maschine
B. Infuzy-Netzwerke
C. K-nearest Nachbar
D. K-Means-Algorithmus
A. MongoDb
B. Sqlite
C. Mysql
D. Mariadb
A. (Keine von diesen)
B. Disjunktes Training
C. Datensätze testen
D. Disjunkte Trainings- und Testdatensätze
A. Überfit
B. Parametrische Analyse
C. Unterfit
D. Schlecht definierte Chernoff -gebunden
A. Heuristische Algorithmen
B. Bayes'sche Inferenzalgorithmen
C. Genetische Algorythmen
D. Clustering -Algorithmen
A. nichts des oben Genannten
B. Einfacher zu trainieren über Online -Lernen
C. mehr Widerstand gegen lokale Minima -Konvergenz
D. parametrisch
A. Knoten
B. Saftquelle
C. UDC
D. DB Connect
A. Nächster Nachbar
B. Logistische Regression
C. Assoziationsmodellabfrage
D. Entscheidungstaum
A. Vorläufige Methodenzuordnung
B. Regeleinführung
C. Fuzzy Logic Application
D. Dynamische Informationsschlüsseln
A. Methoden zum Suche nach einer kompakten Beschreibung für eine Teilmenge von Daten.
B. Erlernen einer Funktion, die ein Datenelement in eine von mehreren vordefinierten Gruppen abbildet.
C. Ein entdecktes Muster, das auf neue Daten mit einem gewissen Grad an Sicherheit zutrifft und auf andere Daten verallgemeinert wird.
D. Eine beschreibende Aufgabe, bei der man versucht, eine endliche Reihe von Kategorien zu identifizieren, um die Daten zu beschreiben.
A. Dreckige Daten reinigen
B. Daten extrahieren
C. Daten reinigen
D. Kaufdaten speichern
A. WAHR
B. FALSCH
A. K-Means-Algorithmus
B. Markov -Ketten
C. Dijkstra Algorithmus
D. Neuronale Netze
A. Beschreibung
B. Leistung
C. Vorhersage
A. Ein Suchalgorithmus, der es uns ermöglicht, eine optimale binäre Zeichenfolge durch Verarbeitung einer anfänglichen zufälligen Population von binären Zeichenfolgen durch Ausführung von Operationen wie künstlicher Mutation, Crossover und Selektion zu lokalisieren.
B. Ein Algorithmus, der schätzt, wie gut ein bestimmtes Muster (ein Modell und seine Parameter) die Kriterien des KDD -Prozesses erfüllt. Die Bewertung der Vorhersagegenauigkeit (Gültigkeit) basiert auf der Kreuzvalidierung. Die Bewertung der deskriptiven Qualität beinhaltet Vorhersage a
C. Ein klassischer Algorithmus für das Lernen von Bergbau- und Verbandsregel über transaktionaler Datenbanken für häufige Elemente. Es erfolgt durch die Identifizierung der häufigen einzelnen Elemente in der Datenbank und erweitert sie auf immer größere Elementsätze, so lange
A. Ein Gesamtmaß für den Musterwert, die Kombination von Gültigkeit, Neuheit, Nützlichkeit und Einfachheit.
B. Ein Ausdruck E in einer Sprache l, die Fakten in einer Untergruppe von F von F beschreibt.
C. Ein mehrstufiger Prozess, der Datenvorbereitung, Mustersuche, Wissensbewertung und Verfeinerung der Iteration nach der Änderung beinhaltet.
D. Ein entdecktes Muster, das auf neue Daten mit einem gewissen Grad an Sicherheit zutrifft und auf andere Daten verallgemeinert wird.
A. Mysql Matrizen
B. verlinkte Listen
C. relationale Datenbanken
D. Schlüsselwertpaar
A. Überprüft die Gültigkeit eines Tokens
B. teilt den Strom der Eingabebereich in Tokens auf
C. erzeugt eine kontextfreie Grammatik
D. verarbeitet den Parse Tree für semantische Bedeutung
A. Eine Aufgabe, die aus Techniken zur Schätzung der Daten aus Daten der gemeinsamen Multi-Variate-Wahrscheinlichkeitsdichtefunktion aller Variablen/Felder in der Datenbank besteht.
B. Eine beschreibende Aufgabe, bei der man versucht, eine endliche Reihe von Kategorien zu identifizieren, um die Daten zu beschreiben.
C. Lernen Sie eine Funktion, die ein Datenelement in eine von mehreren vordefinierten Gruppen oder Clustern abbildet.
D. Der Prozess des Auffindens eines Modells, das signifikante Abhängigkeiten zwischen Variablen beschreibt
A. Verwendung eines Datenwörterbuchs
B. Programm und Daten entkoppeln
C. Minimieren von isolierten Dateien mit wiederholten Daten
D. Durchsetzung der Referenzintegrität
A. Beschreibende Modellierungsanalyse
B. Clusteranalyse
C. Explorationsdatenanalyse
D. Vorhersageanalyse
A. Lineare Regression
B. Clustering
C. Wissen
D. Meta-Daten
A. Backpropagation
B. zufällige Initalisierung von Gewichten
C. kontinuierliche Ausgabe
D. in der Lage, nichtlineare Trennungen zu lernen
A. Wählen
B. Stapelung
C. Mittelung
D. Bootstrapping
A. Eine Aufgabe, die sich darauf konzentriert, die bedeutendsten Änderungen der Daten aus zuvor gemessenen oder normativen Werten zu ermitteln
B. Eine beschreibende Aufgabe, bei der man versucht, eine endliche Reihe von Kategorien zu identifizieren, um die Daten zu beschreiben.
C. Der Prozess des Auffindens eines Modells, das signifikante Abhängigkeiten zwischen Variablen beschreibt
D. Methoden zum Suche nach einer kompakten Beschreibung für eine Teilmenge von Daten.
A. Validierung
B. Unterstützung
C. Überwachtes Lernen
D. Topologie
A. logistische Funktion
B. Mehrschichtiger NN kann die kontinuierliche Ausgabe nicht berechnen
C. Hyperbolische Funktion
D. logarithmische Funktion
A. Eine Programmiersprache, die es Hadoop ermöglicht, als Data Warehouse zu arbeiten.
B. Keine von diesen
C. Eine Programmiersprache, die die gängigen Aufgaben der Arbeit mit Hadoop vereinfacht.
A. Fuzzy -Probenahme
B. Klasseneinteilung
C. Erhöhen
D. Clustering
A. // a/[enthält (@href, " Profil ")]
B. // a/[containes (@href, " Profil ")]/@href
C. // href/Profil
D. //Ein Profil
A. DBSCAN
B. Id3
C. nichts des oben Genannten
D. logistische Regression
A. staatenlos
B. linear separabel
C. Gibt die JSON -Ausgabe zurück
D. Staatsbürgerlich
A. Datanode
B. FS Shell
C. Dfsadmin
D. Namenode
A. Facettenreich
B. Mehrblatt
C. Multivariiert
D. Multimodal
A. Ergänzende Geschäftsziele und -bedürfnisse fest erfassen
B. Bewerten Sie die aktuelle Situation, indem Sie die Ressourcen, Annahmen, Einschränkungen usw. herausfinden.
C. Erstellen Sie Data Mining -Ziele, um die Geschäftsziele zu erreichen
D. Erstellen Sie eine Liste aller relevanten Algorithmen, die auf die Aufgabe angewendet werden sollen
A. Ein Befehlszeilen-Tool zum Abrufen von Dateien
B. Eine Methodik zur Klassifizierung versteckter Datenmerkmale von Daten
C. Der Teil von HTTP, der die Zugriffserlaubnis angibt
D. Kombinatorischer unbeaufsichtigter rekursiver Lernalgorithmus
A. Numerische Ebene
B. Grundstufe
C. Abhängigkeitsstufe
D. Quantitative Ebene
A. Normale Mischmodelle
B. Kandidat Generation
C. Überanpassungsmethoden
D. Keine von diesen
A. Https
B. PGP
C. Oauth
D. SSL
A. Datenintegration
B. Data Mining
C. Datenreinigung
D. Datenquantifizierung
A. Clusteranalyse
B. Wenn ... dann ... Analyse
C. Regressionsanalyse
D. Marktkorbanalyse
A. 1/n^2
B. 1/n
C. 1-1/n^2
D. 1/2n
A. Alles das oben Genannte
B. Logistische Regression
C. Arima
D. Nichtlineare Regression
E. Regression
A. Sortieren
B. Reduzieren
C. Karte
D. Mischen
A. No-Copping
B. Magnetische Kopplung
C. Transitive Kopplung
D. QuickStart -Kopplung
A. WAHR
B. FALSCH
A. Lärm
B. Ausreißer
C. Bereich
D. Nicht anwendbare Daten
A. Techniken zur Verbesserung der Effizienz eines Apriori -Algorithmus
B. Methode zum wiederholten Scannen der Datenbank und überprüfen Sie einen großen Satz von Kandidaten durch Musteranpassung.
C. Methoden zur Erzeugung häufiger Artikelsätze ohne Kandidatenerzeugung.
D. Methoden zum Suche nach einer kompakten Beschreibung für eine Teilmenge von Daten.
A. Kundenempfehlung
B. Feiertagsverkauf
C. Geld-Zurück-Garantie
D. Kundenkarten
A. ID3 (iterative Dichotomiser 3)
B. C4.5 Algorithmus
C. Wagen (Klassifizierung und Regressionsbäume)
D. Chaid (CHI Square Automatic Interaction Detection)
A. Verwendet iterative Verfeinerung
B. resistenter gegen Ausreißer
C. Alles das oben Genannte
D. repräsentiert Cluster nach der Mitte
A. Verarbeitung und Verwaltung
B. Quelle und Ergebnisse
C. Management und Lieferung
D. Anwendung und Lieferung
A. Alle oben genannten sind angemessen
B. Selen
C. Phantomjs
D. wget
A. Vorhersageanalyse
B. Funktionsaktivierung
C. Linkanalyse
D. Clustering
A. Varianz messen
B. Relevanz messen
C. Genauigkeit von Meaure
D. Messen Sie den Auftrieb
A. {" Antwort " ;: " Dieser eine "}
B. {" Antwort ": [" Dies ist "]}
C. {[" Antwort " ;: " Dieser eine "]}
D. Alle sind gültig
A. HTTP -Anfrage -Header
B. Kekse
C. Server -Protokolldateien
D. Alles das oben Genannte