Preguntas de minería de datos en idiomas españoles

Preguntas de minería de datos en idiomas españoles

Estas preguntas y respuestas de selección múltiple de minería de datos lo ayudarán a comprender mejor el tema de la minería de datos. Puede prepararse para su próximo examen o entrevista con estos 100+ MCQ Data Collection.
Así que desplácese hacia abajo y comience a responder.

1: ¿Qué industria puede beneficiarse de la minería de datos?

A.   Todos estos

B.   Minorista

C.   Fabricación

D.   Banca financiera

2: ¿Con cuál de estas capas comienza una red neuronal?

A.   Capa de salida

B.   Capa oculta

C.   Capa transparente

D.   Capa de entrada

3: Los cambios en partes de un código podrían conducir al problema de los datos ______________.

A.   inconsistente

B.   sucio

C.   no integrado

D.   granular

4: En una red neuronal, ¿a qué se refiere la topología?

A.   El rango de variables en un conjunto

B.   El número de nodos utilizados

C.   La visualización gráfica de los datos

D.   El número de capas y el número de nodos en cada capa

5: ¿Cuál de los siguientes algoritmos de agrupación puede encontrar grupos de forma arbitraria?

A.   Un solo enlace

B.   Dsbscan

C.   Ambos

D.   Ninguno de esos

6: Los árboles de decisión pueden manejar valores faltantes sin usar ninguna transformación de imputación. ¿Verdadero o falso?

A.   FALSO

B.   Verdadero

7: Un algoritmo (n) _____ crea reglas que describen con qué frecuencia se han producido eventos juntos.

A.   Chaido

B.   artificial

C.   poda

D.   asociativo

8: ¿Cuál de los siguientes es XML válido?

A.   & lt; Body Respuesta = " Válido " & gt; este & lt;/Body & gt;

B.   & lt; válido & gt; este & lt;/válido & gt;

C.   & lt; válido & gt; " Este " & lt;/válido & gt;

D.   Todos son válidos

9: ¿Cuál de las siguientes no es una base de datos relacional?

A.   Todo lo anterior

B.   Apache Cassandra

C.   Grandes mesa de Google

D.   Mongodb

10: ¿Qué es la visualización de datos?

A.   El término técnico para el acto de datos que se almacenan en un servidor

B.   Una predicción estructurada y desarrollada de los resultados de los datos

C.   La interpretación visual de relaciones complejas en datos multidimensionales

11: ¿Qué es un proceso KDD?

A.   Descifrado diferencial

B.   Knoop-Hardness medido a través de una dimensión de alto impacto

C.   Descubrimiento de conocimiento en bases de datos

D.   K-Mean Data Discovery

12: ¿Cuáles de estos no son tipos de software analítico?

A.   Todos son tipos válidos

B.   Red neuronal

C.   Estadístico

D.   Aprendizaje automático

13: ¿Verdadero o falso? Los indicadores económicos son factores de datos externos.

A.   FALSO

B.   Verdadero

14: ¿Cuál de las siguientes disciplinas se superpone a la minería de datos?

A.   Todo lo anterior

B.   Inteligencia artificial

C.   Estadísticas

D.   Lingüística

15: En los modelos predictivos, los valores o clases a predecir se denominan:

A.   Dependiente

B.   Todos estos

C.   Respuesta

D.   Variables objetivo

16: Usted es un gerente de riesgo de crédito de un banco minorista. Algunas información sobre los clientes están disponibles para el análisis. Según estos datos, debe decidir que una persona será un cliente bueno o malo. Elija la tarea de minería de datos adecuada para estos problemas comerciales.

A.   Clasificación

B.   Regresión

C.   Segmentación

17: Los elementos de datos agrupados en relaciones y preferencias se conocen como:

A.   Conjuntos predecibles

B.   Organizaciones de anuncios

C.   Grados de ajuste

D.   Grupos

18: ¿Qué son los árboles de decisión?

A.   Informes complejos generados por un científico de datos calificado

B.   Dimensiones jerárquicas que se pueden crear con un navegador Hyper Cube

C.   Datos no recopilados por la organización, como los datos disponibles de un libro de referencia

D.   Estructuras que generan reglas para la clasificación de un conjunto de datos

19: ¿Cuáles son los métodos populares de minería de datos?

A.   Modelos de aprendizaje relacional

B.   Árboles de decisión y reglas

C.   Todos estos

D.   Modelos de dependencia gráfica probabilística

20: ¿Verdadero o falso? La arquitectura de minería de datos de acoplamiento suelto es principalmente para sistemas de minería de datos basados ​​en memoria que no requieren alta escalabilidad y alto rendimiento.

A.   FALSO

B.   Verdadero

21: ¿Qué es CRISP-DM?

A.   Un árbol de decisión desarrollado en 1980 ' s pero casi completamente reemplazado por el método del carrito de hoy

B.   Un método de seis fases para predecir los hábitos de compra de comercio electrónico

C.   Algoritmo de regresión lineal de Microsoft '

D.   Un proceso estándar de la industria cruzada para la minería de datos

22: Una función utilizada por un nodo en una red neuronal para transformar datos de entrada de cualquier dominio de valores en un rango finito de valores se conoce como (n):

A.   Antecedente

B.   Función de activación

C.   Matriz de confusión

D.   Chi-cuadrado

23: ¿Verdadero o falso? Las pruebas en el carrito son siempre binarias.

A.   Verdadero

B.   FALSO

24: ¿Cuál es la medida de cuánto cambian dos variables aleatorias juntas?

A.   desviación estándar binaria

B.   covarianza

C.   policonvergencia

D.   inercia estocástica

25: ¿Cuál de estos es un ejemplo de una relación de patrón secuencial?

A.   Uso de la experiencia comercial y el instinto para diseñar un nuevo plano en una tienda de comestibles

B.   Reorganizar la alineación inicial de su equipo de baloncesto basada en un análisis de rendimiento

C.   Colocar dos artículos comprados frecuentemente uno al lado del otro en el estante

D.   Predecir la probabilidad de que se compre una mochila en función de la compra de sacos de dormir y zapatos de senderismo de un consumidor

26: Los ingresos anuales de una compañía internacional se correlacionan con otros atributos como publicidad, tipo de cambio, tasa de inflación, etc. Tener estos valores (o sus estimaciones confiables para el próximo año) la compañía tiene que calcular sus ingresos esperados para el próximo año. Elija la tarea de minería de datos apropiada para este problema comercial.

A.   Segmentación

B.   Clasificación

C.   Regresión

27: ¿Cuál es la capa frontal de la arquitectura de minería de datos?

A.   Una interfaz de usuario intuitiva y fácil de usar

B.   Firewalls establecidos para proteger los datos de fuentes maliciosas

C.   El hardware diseñado específicamente para el almacenamiento de cantidades masivas de datos

D.   El equipo de programadores que diseñó el software utilizado en un proyecto minero en particular

28: Un hiperplano es un

A.   Límite de decisión Separación de clases de datos

B.   variante del algoritmo C4.5

C.   Colección de archivos de hipertexto vinculados

D.   condición de error no terminado

29: Los datos no recopilados por la organización, como los datos de una base de datos patentada, que se combinan con los datos propios de la organización se conoce como:

A.   Superpuesto

B.   Exagerado

C.   Ruido

D.   Fecha no aplicable

30: ¿Cuáles de estos no se consideran factores de datos internos?

A.   Precio

B.   Recesiones económicas

C.   Habilidades del personal

D.   Posicionamiento del producto

31: ¿Qué técnica de minería de datos organiza conjuntos de datos en grupos predefinidos?

A.   Patrón secuencial

B.   Agrupación

C.   Clasificación

D.   Gamificación

32: El nivel del modelo que especifica (a menudo gráficamente) qué variables dependen localmente entre sí.

A.   Nivel estructural

B.   Nivel cualitativo

C.   Nivel primario

D.   Nivel cuantitativo

33: Para aumentar la confianza de su estado de rendimiento de clasificación en toda la población, debe:

A.   Disminuir el tamaño del conjunto de datos de entrenamiento

B.   Aumentar el tamaño del conjunto de datos de capacitación

C.   Aumente el tamaño del conjunto de datos de prueba

D.   Disminuir el tamaño del conjunto de datos de prueba

34: El algoritmo que alimenta el motor de búsqueda de Google es:

A.   Adaboost

B.   El método Brin-Page

C.   Googlecrawler

D.   Rango de página

35: En la asociación entre dos variables, ¿cuál es la diferencia entre el antecedente y el consecuente?

A.   El antecedente es siempre una variable muy compleja

B.   Nada, son intercambiables

C.   El antecedente está a la derecha, el consecuente está a la izquierda.

D.   El antecedente está a la izquierda, el consecuente a la derecha

36: En el análisis de los datos de la serie temporal, el valor medio durante un período de tiempo determinado (generalmente algún intervalo en el pasado hasta el presente) se llama (n)

A.   promedio parcial

B.   media imparcial

C.   media compuesta

D.   media móvil

37: ¿Qué es la regresión?

A.   Aprender una función que asigna un elemento de datos en uno de varios grupos predefinidos.

B.   Una expresión e en un lenguaje l describiendo hechos en un subconjunto Fe de F.

C.   Una tarea descriptiva en la que se busca identificar un conjunto finito de categorías para describir los datos.

D.   Aprender una función que asigna un elemento de datos a una variable de predicción de valor real.

38: ¿Qué es el modelado de dependencia?

A.   Un proceso de varios pasos que involucra la preparación de datos, búsqueda de patrones, evaluación de conocimiento y refinamiento con iteración después de la modificación.

B.   Aprender una función que asigna un elemento de datos en uno de varios grupos o grupos predefinidos.

C.   El proceso de encontrar un modelo que describe dependencias significativas entre las variables

D.   Una tarea que consiste en técnicas para estimar, a partir de los datos, la función de densidad de probabilidad multvariable conjunta de todas las variables/campos en la base de datos.

39: ¿Cuál de estos no es una descripciones comunes de capas?

A.   Oculto

B.   Aporte

C.   Producción

D.   Funcional

40: El fragmento se refiere a:

A.   una medida del ruido en un contenido de una base de datos

B.   Partir una base de datos para su distribución en diferentes servidores

C.   Accediendo simultáneamente a las bases de datos de objetos múltiples a través de SSH

D.   Ninguna de las anteriores

41: ¿Qué es el cambio y la detección de desviación?

A.   Una tarea que se centra en descubrir los cambios más significativos en los datos de valores medidos o normativos previamente medidos

B.   Métodos para encontrar una descripción compacta para un subconjunto de datos.

C.   El proceso de encontrar un modelo que describe dependencias significativas entre variables

D.   Una tarea que consiste en técnicas para estimar, a partir de los datos, la función de densidad de probabilidad multvariable conjunta de todas las variables/campos en la base de datos.

42: ¿Cuál es el tipo de minería de datos que impulsa el sistema de recomendación de Amazon.com?

A.   Lógica difusa

B.   Aprendizaje de la asociación

C.   Detección de anomalías

D.   Algoritmos de agrupación

43: ¿Cuál de los siguientes algoritmos es generalmente adecuado para tareas de aprendizaje no supervisadas?

A.   Máquina Boltzmann restringida

B.   Redes de información de información

C.   K-Near más vecino

D.   algoritmo k-means

44: ¿Cuál de las siguientes soluciones de almacenamiento es más apropiada para un conjunto de datos semiestructurado cuyos miembros no tienen los mismos atributos?

A.   Mongodb

B.   Sqlite

C.   Mysql

D.   Mariada

45: Para estimar el rendimiento de clasificación en una población completa, necesita _______

A.   (Ninguno de esos)

B.   Capacitación disjunta

C.   Conjuntos de datos

D.   Entrenamientos de capacitación y prueba de desargoración de conjuntos de datos

46: El error de generalización es una consecuencia de

A.   Overfit

B.   Análisis paramétrico

C.   Poco fijo

D.   Boundoff mal definido mal definido

47: ¿Cuáles de estos son métodos computacionales evolutivos?

A.   Algoritmos heurísticos

B.   Algoritmos de inferencia bayesiana

C.   Algoritmos genéticos

D.   Algoritmos de agrupación

48: Las máquinas vectoriales de soporte tienen una ventaja sobre las redes neuronales porque son svm ' s

A.   Ninguna de las anteriores

B.   Más fácil de entrenar a través del aprendizaje en línea

C.   más resistente a la convergencia mínima local

D.   paramétrico

49: ¿Cuál de los siguientes no es un sistema fuente común?

A.   Nodo

B.   Fuente de SAP

C.   UDC

D.   DB Connect

50: Una técnica que clasifica cada registro en un conjunto de datos basado en una combinación de las clases de los registros K más similares en un conjunto de datos histórico es:

A.   Vecino más cercano

B.   Regresión logística

C.   Consulta de modelo de asociación

D.   Árbol de decisión