Estas preguntas y respuestas de selección múltiple de minería de datos lo ayudarán a comprender mejor el tema de la minería de datos. Puede prepararse para su próximo examen o entrevista con estos 100+ MCQ Data Collection.
Así que desplácese hacia abajo y comience a responder.
A. Todos estos
B. Minorista
C. Fabricación
D. Banca financiera
A. Capa de salida
B. Capa oculta
C. Capa transparente
D. Capa de entrada
A. inconsistente
B. sucio
C. no integrado
D. granular
A. El rango de variables en un conjunto
B. El número de nodos utilizados
C. La visualización gráfica de los datos
D. El número de capas y el número de nodos en cada capa
A. Un solo enlace
B. Dsbscan
C. Ambos
D. Ninguno de esos
A. FALSO
B. Verdadero
A. Chaido
B. artificial
C. poda
D. asociativo
A. & lt; Body Respuesta = " Válido " & gt; este & lt;/Body & gt;
B. & lt; válido & gt; este & lt;/válido & gt;
C. & lt; válido & gt; " Este " & lt;/válido & gt;
D. Todos son válidos
A. Todo lo anterior
B. Apache Cassandra
C. Grandes mesa de Google
D. Mongodb
A. El término técnico para el acto de datos que se almacenan en un servidor
B. Una predicción estructurada y desarrollada de los resultados de los datos
C. La interpretación visual de relaciones complejas en datos multidimensionales
A. Descifrado diferencial
B. Knoop-Hardness medido a través de una dimensión de alto impacto
C. Descubrimiento de conocimiento en bases de datos
D. K-Mean Data Discovery
A. Todos son tipos válidos
B. Red neuronal
C. Estadístico
D. Aprendizaje automático
A. FALSO
B. Verdadero
A. Todo lo anterior
B. Inteligencia artificial
C. Estadísticas
D. Lingüística
A. Dependiente
B. Todos estos
C. Respuesta
D. Variables objetivo
A. Clasificación
B. Regresión
C. Segmentación
A. Conjuntos predecibles
B. Organizaciones de anuncios
C. Grados de ajuste
D. Grupos
A. Informes complejos generados por un científico de datos calificado
B. Dimensiones jerárquicas que se pueden crear con un navegador Hyper Cube
C. Datos no recopilados por la organización, como los datos disponibles de un libro de referencia
D. Estructuras que generan reglas para la clasificación de un conjunto de datos
A. Modelos de aprendizaje relacional
B. Árboles de decisión y reglas
C. Todos estos
D. Modelos de dependencia gráfica probabilística
A. FALSO
B. Verdadero
A. Un árbol de decisión desarrollado en 1980 ' s pero casi completamente reemplazado por el método del carrito de hoy
B. Un método de seis fases para predecir los hábitos de compra de comercio electrónico
C. Algoritmo de regresión lineal de Microsoft '
D. Un proceso estándar de la industria cruzada para la minería de datos
A. Antecedente
B. Función de activación
C. Matriz de confusión
D. Chi-cuadrado
A. Verdadero
B. FALSO
A. desviación estándar binaria
B. covarianza
C. policonvergencia
D. inercia estocástica
A. Uso de la experiencia comercial y el instinto para diseñar un nuevo plano en una tienda de comestibles
B. Reorganizar la alineación inicial de su equipo de baloncesto basada en un análisis de rendimiento
C. Colocar dos artículos comprados frecuentemente uno al lado del otro en el estante
D. Predecir la probabilidad de que se compre una mochila en función de la compra de sacos de dormir y zapatos de senderismo de un consumidor
A. Segmentación
B. Clasificación
C. Regresión
A. Una interfaz de usuario intuitiva y fácil de usar
B. Firewalls establecidos para proteger los datos de fuentes maliciosas
C. El hardware diseñado específicamente para el almacenamiento de cantidades masivas de datos
D. El equipo de programadores que diseñó el software utilizado en un proyecto minero en particular
A. Límite de decisión Separación de clases de datos
B. variante del algoritmo C4.5
C. Colección de archivos de hipertexto vinculados
D. condición de error no terminado
A. Superpuesto
B. Exagerado
C. Ruido
D. Fecha no aplicable
A. Precio
B. Recesiones económicas
C. Habilidades del personal
D. Posicionamiento del producto
A. Patrón secuencial
B. Agrupación
C. Clasificación
D. Gamificación
A. Nivel estructural
B. Nivel cualitativo
C. Nivel primario
D. Nivel cuantitativo
A. Disminuir el tamaño del conjunto de datos de entrenamiento
B. Aumentar el tamaño del conjunto de datos de capacitación
C. Aumente el tamaño del conjunto de datos de prueba
D. Disminuir el tamaño del conjunto de datos de prueba
A. Adaboost
B. El método Brin-Page
C. Googlecrawler
D. Rango de página
A. El antecedente es siempre una variable muy compleja
B. Nada, son intercambiables
C. El antecedente está a la derecha, el consecuente está a la izquierda.
D. El antecedente está a la izquierda, el consecuente a la derecha
A. promedio parcial
B. media imparcial
C. media compuesta
D. media móvil
A. Aprender una función que asigna un elemento de datos en uno de varios grupos predefinidos.
B. Una expresión e en un lenguaje l describiendo hechos en un subconjunto Fe de F.
C. Una tarea descriptiva en la que se busca identificar un conjunto finito de categorías para describir los datos.
D. Aprender una función que asigna un elemento de datos a una variable de predicción de valor real.
A. Un proceso de varios pasos que involucra la preparación de datos, búsqueda de patrones, evaluación de conocimiento y refinamiento con iteración después de la modificación.
B. Aprender una función que asigna un elemento de datos en uno de varios grupos o grupos predefinidos.
C. El proceso de encontrar un modelo que describe dependencias significativas entre las variables
D. Una tarea que consiste en técnicas para estimar, a partir de los datos, la función de densidad de probabilidad multvariable conjunta de todas las variables/campos en la base de datos.
A. Oculto
B. Aporte
C. Producción
D. Funcional
A. una medida del ruido en un contenido de una base de datos
B. Partir una base de datos para su distribución en diferentes servidores
C. Accediendo simultáneamente a las bases de datos de objetos múltiples a través de SSH
D. Ninguna de las anteriores
A. Una tarea que se centra en descubrir los cambios más significativos en los datos de valores medidos o normativos previamente medidos
B. Métodos para encontrar una descripción compacta para un subconjunto de datos.
C. El proceso de encontrar un modelo que describe dependencias significativas entre variables
D. Una tarea que consiste en técnicas para estimar, a partir de los datos, la función de densidad de probabilidad multvariable conjunta de todas las variables/campos en la base de datos.
A. Lógica difusa
B. Aprendizaje de la asociación
C. Detección de anomalías
D. Algoritmos de agrupación
A. Máquina Boltzmann restringida
B. Redes de información de información
C. K-Near más vecino
D. algoritmo k-means
A. Mongodb
B. Sqlite
C. Mysql
D. Mariada
A. (Ninguno de esos)
B. Capacitación disjunta
C. Conjuntos de datos
D. Entrenamientos de capacitación y prueba de desargoración de conjuntos de datos
A. Overfit
B. Análisis paramétrico
C. Poco fijo
D. Boundoff mal definido mal definido
A. Algoritmos heurísticos
B. Algoritmos de inferencia bayesiana
C. Algoritmos genéticos
D. Algoritmos de agrupación
A. Ninguna de las anteriores
B. Más fácil de entrenar a través del aprendizaje en línea
C. más resistente a la convergencia mínima local
D. paramétrico
A. Nodo
B. Fuente de SAP
C. UDC
D. DB Connect
A. Vecino más cercano
B. Regresión logística
C. Consulta de modelo de asociación
D. Árbol de decisión
A. Mapeo de métodos preliminares
B. Inducción de reglas
C. Aplicación lógica difusa
D. Inferencia de información dinámica
A. Métodos para encontrar una descripción compacta para un subconjunto de datos.
B. Aprender una función que asigna un elemento de datos en uno de varios grupos predefinidos.
C. Un patrón descubierto que es cierto en nuevos datos con cierto grado de certeza, y se generaliza a otros datos.
D. Una tarea descriptiva en la que se busca identificar un conjunto finito de categorías para describir los datos.
A. Limpieza de datos sucios
B. Extracción de datos
C. Datos de limpieza
D. Almacenamiento de datos comprados
A. Verdadero
B. FALSO
A. algoritmo K-means
B. Cadenas de Markov
C. Algoritmo de Dijkstra
D. Redes neuronales
A. Descripción
B. Actuación
C. Predicción
A. Un algoritmo de búsqueda que nos permite localizar una cadena binaria óptima procesando una población aleatoria inicial de cadenas binarias mediante operaciones realizadas como mutación artificial, crossover y selección.
B. Un algoritmo que estima qué tan bien un patrón particular (un modelo y sus parámetros) cumple con los criterios del proceso KDD. La evaluación de la precisión predictiva (validez) se basa en la validación cruzada. La evaluación de la calidad descriptiva implica un predictivo A
C. Un algoritmo clásico para el aprendizaje de reglas de minería y asociación de conjuntos de elementos frecuentes sobre bases de datos transaccionales. Continúa identificando los elementos individuales frecuentes en la base de datos y extendiéndolos a conjuntos de elementos cada vez más grandes siempre que esos elementos S
A. Una medida general del valor del patrón, combinando validez, novedad, utilidad y simplicidad.
B. Una expresión e en un lenguaje l describiendo hechos en un subconjunto Fe de F.
C. Un proceso de varios pasos que involucra la preparación de datos, búsqueda de patrones, evaluación de conocimiento y refinamiento con iteración después de la modificación.
D. Un patrón descubierto que es cierto en nuevos datos con cierto grado de certeza, y se generaliza a otros datos.
A. Matrices mysql
B. listas vinculadas
C. bases de datos relacionales
D. par de valores clave
A. Verifica la validez de un token
B. divide la corriente de caracteres de entrada en tokens
C. genera una gramática sin contexto
D. procesa el árbol de análisis para el significado semántico
A. Una tarea que consiste en técnicas para estimar, a partir de los datos, la función de densidad de probabilidad multvariable conjunta de todas las variables/campos en la base de datos.
B. Una tarea descriptiva en la que se busca identificar un conjunto finito de categorías para describir los datos.
C. Aprender una función que asigna un elemento de datos en uno de varios grupos o grupos predefinidos.
D. El proceso de encontrar un modelo que describe dependencias significativas entre variables
A. Utilización de un diccionario de datos
B. Programa y datos de desacoplamiento
C. Minimizar archivos aislados con datos repetidos
D. Hacer cumplir la integridad referencial
A. Análisis de modelado descriptivo
B. Análisis de conglomerados
C. Análisis exploratorio de datos
D. Análisis predictivo
A. Regresión lineal
B. Agrupación
C. Conocimiento
D. Meta-data
A. backpropagation
B. initalización aleatoria de pesos
C. salida continua
D. capaz de aprender separaciones no lineales
A. Votación
B. Apilado
C. Promedio
D. Bootstrapping
A. Una tarea que se centra en descubrir los cambios más significativos en los datos de los valores medidos o normativos previamente medidos
B. Una tarea descriptiva en la que se busca identificar un conjunto finito de categorías para describir los datos.
C. El proceso de encontrar un modelo que describe dependencias significativas entre variables
D. Métodos para encontrar una descripción compacta para un subconjunto de datos.
A. Validación
B. Apoyo
C. Aprendizaje supervisado
D. Topología
A. función logística
B. NN de varias capas no puede calcular la salida continua
C. función hiperbólica
D. función logarítmica
A. Un lenguaje de programación que permite a Hadoop operar como un almacén de datos.
B. Ninguno de esos
C. Un lenguaje de programación que simplifica las tareas comunes de trabajar con Hadoop.
A. Muestreo difuso
B. Binning
C. Aumento de
D. Agrupación
A. // a/[contiene (@href, " perfil ")]
B. // a/[contiene (@href, " perfil ")]/@href
C. // href/perfil
D. //un perfil
A. Dbscan
B. ID3
C. Ninguna de las anteriores
D. Regresión logística
A. apátrate
B. linealmente separable
C. Devuelve la salida de JSON
D. de estado
A. Datanode
B. Fs caparazón
C. Dfsadmin
D. Namenode
A. Multifacético
B. Múltiple
C. Multivariado
D. Multimodal
A. Comprende firmemente los objetivos y necesidades comerciales
B. Evaluar la situación actual descubriendo los recursos, supuestos, restricciones, etc.
C. Crear objetivos de minería de datos para lograr los objetivos comerciales
D. Cree una lista de todos los algoritmos relevantes que se aplicarán a la tarea
A. Una herramienta de línea de comandos para recuperar archivos
B. Una metodología para clasificar las características ocultas de los datos
C. La parte de HTTP que especifica el permiso de acceso
D. Algoritmo de aprendizaje recursivo combinatorial no supervisado
A. Nivel numérico
B. Nivel primario
C. Nivel de dependencia
D. Nivel cuantitativo
A. Modelos de mezcla normal
B. Generación candidata
C. Métodos de sobreajuste
D. Ninguno de esos
A. Https
B. PGP
C. Oauth
D. Ssl
A. Integración de datos
B. Procesamiento de datos
C. Limpieza de datos
D. Cuantificación de datos
A. Análisis de conglomerados
B. Si ... entonces ... Análisis
C. Análisis de regresión
D. Análisis de la cesta del mercado
A. 1/n^2
B. 1/n
C. 1-1/n^2
D. 1/2n
A. Todo lo anterior
B. Regresión logística
C. Arima
D. Regresión no lineal
E. Regresión
A. Clasificar
B. Reducir
C. Mapa
D. Barajar
A. No acoplamiento
B. Acoplamiento Magnético
C. Acoplamiento transitivo
D. Acoplamiento rápido
A. Verdadero
B. FALSO
A. Ruido
B. Valores atípicos
C. Rango
D. Datos no aplicables
A. Técnicas para mejorar la eficiencia de un algoritmo Apriori
B. Método para escanear repetidamente el escaneo de la base de datos y verificar un gran conjunto de candidatos mediante la coincidencia de patrones.
C. Métodos para generar conjuntos de elementos frecuentes sin generación de candidatos.
D. Métodos para encontrar una descripción compacta para un subconjunto de datos.
A. Recomendaciones de clientes
B. venta de vacaciones
C. Garantía de devolución del dinero
D. Tarjetas de lealtad
A. ID3 (dicotomizador iterativo 3)
B. Algoritmo C4.5
C. Cart (árboles de clasificación y regresión)
D. CHAID (Detección de interacción automática de Chi Square)
A. Utiliza un refinamiento iterativo
B. más resistente a los valores atípicos
C. todo lo anterior
D. representa grupos por centro
A. Procesamiento y gestión
B. Fuente y resultados
C. Gestión y entrega
D. Aplicación y entrega
A. Todos los anteriores son apropiados
B. Selenio
C. Fantomjs
D. wget
A. Análisis predictivo
B. Activación de funciones
C. Análisis de enlaces
D. Agrupación
A. medir varianza
B. medir relevancia
C. precisión
D. Medir ascensor
A. {" Respuesta ": " Este "}
B. {" respuesta ": [" Este "]}
C. {[" respuesta ": " este "]}
D. Todos son válidos
A. Encabezados de solicitud de http
B. galletas
C. Filos de registro del servidor
D. todo lo anterior