Questões de Data Mining em Língua Portuguesa

Questões de Data Mining em Língua Portuguesa

Essas perguntas e respostas de múltipla escolha sobre mineração de dados ajudarão você a entender melhor os tópicos de mineração de dados. Prepare-se para o seu próximo exame ou entrevista com essas mais de 100 coleções de dados MCQ.
Role para baixo para começar a responder.

1: Qual indústria pode se beneficiar da mineração de dados?

A.   Todos esses

B.   Varejo

C.   Fabricação

D.   Finanças/bancos

2: Com qual dessas camadas inicia uma rede neural?

A.   Camada de saída

B.   Camada oculta

C.   Camada transparente

D.   Camada de entrada

3: Alterações nas partes de um código podem levar ao problema dos dados ______________.

A.   inconsistente

B.   sujo

C.   não integrado

D.   granular

4: Em uma rede neural, o que a topologia se refere?

A.   A gama de variáveis ​​em um conjunto

B.   O número de nós utilizados

C.   A visualização gráfica dos dados

D.   O número de camadas e o número de nós em cada camada

5: Qual dos seguintes algoritmos de agrupamento pode encontrar grupos de forma arbitrária?

A.   Único link

B.   Dsbscan

C.   Ambos estes

D.   Nenhum desses

6: As árvores de decisão são capazes de lidar com valores ausentes sem usar qualquer transformação de impacto. Verdadeiro ou falso?

A.   Falso

B.   Verdadeiro

7: Um algoritmo (n) _____ cria regras que descrevem com que frequência os eventos ocorrem juntos.

A.   CHAID

B.   artificial

C.   podando

D.   Associativa

8: Qual das alternativas a seguir é XML válida?

A.   & lt; Resposta do corpo = " válido " & gt; este & lt;/body & gt;

B.   & lt; válido & gt; este & lt;/válido & gt;

C.   & lt; válido & gt; " este " & lt;/válido & gt;

D.   Todos são válidos

9: Qual das alternativas a seguir não é um banco de dados relacional?

A.   Tudo o que precede

B.   Apache Cassandra

C.   Tabela grande do Google

D.   MongoDB

10: O que é visualização de dados?

A.   O termo técnico para o ato de dados que estão sendo armazenados em um servidor

B.   Uma previsão estruturada e desenvolvida dos resultados dos dados

C.   A interpretação visual de relacionamentos complexos em dados multidimensionais

11: O que é um processo KDD?

A.   Decripção diferencial

B.   Hardness Knoop medido através da dimensão de alto impacto

C.   Descoberta de conhecimento em bancos de dados

D.   Descoberta de dados K-Mean

12: Quais destes não são tipos de software analítico:

A.   Todos são tipos válidos

B.   Rede neural

C.   Estatística

D.   Aprendizado de máquina

13: Verdadeiro ou falso? Indicadores econômicos são fatores de dados externos.

A.   Falso

B.   Verdadeiro

14: Qual das seguintes disciplinas se sobrepõe à mineração de dados?

A.   Tudo o que precede

B.   Inteligência artificial

C.   Estatisticas

D.   Linguística

15: Em modelos preditivos, os valores ou classes a serem previstos são chamados de:

A.   Dependente

B.   Todos esses

C.   Resposta

D.   Variáveis ​​de destino

16: Você é um gerente de risco de crédito de um banco de varejo. Algumas informações sobre os clientes estão disponíveis para análise. Com base nesses dados, você deve decidir que uma pessoa será um cliente bom ou ruim. Escolha a tarefa de mineração de dados apropriada para esses problemas de negócios.

A.   Classificação

B.   Regressão

C.   Segmentação

17: Os itens de dados agrupados em relacionamentos e preferências são conhecidos como:

A.   Conjuntos previsíveis

B.   Organizações pungentes

C.   Graus de ajuste

D.   Clusters

18: O que são árvores de decisão?

A.   Relatórios complexos gerados por um cientista de dados qualificado

B.   Dimensões hierárquicas que podem ser criadas com um navegador hiper -cubo

C.   Dados não coletados pela organização, como dados disponíveis em um livro de referência

D.   Estruturas que geram regras para a classificação de um conjunto de dados

19: Quais são os métodos populares de mineração de dados?

A.   Modelos de aprendizado relacional

B.   Árvores de decisão e regras

C.   Todos esses

D.   Modelos probabilísticos de dependência gráfica

20: Verdadeiro de falso? A arquitetura de mineração de dados de acoplamento solta é principalmente para sistemas de mineração de dados baseados em memória que não requerem alta escalabilidade e alto desempenho.

A.   Falso

B.   Verdadeiro

21: O que é Crisp-DM?

A.   Uma árvore de decisão desenvolvida nos anos 1980, mas quase totalmente substituída pelo método do carrinho hoje

B.   Um método de seis fases para prever hábitos de compra de comércio eletrônico

C.   Algoritmo de regressão linear da Microsoft

D.   Um processo padrão entre indústrias para mineração de dados

22: Uma função usada por um nó em uma rede neural para transformar dados de entrada de qualquer domínio de valores em uma gama finita de valores é conhecida como (n):

A.   Antecedente

B.   Função de ativação

C.   Matriz de confusão

D.   Qui-quadrado

23: Verdadeiro ou falso? Os testes no carrinho são sempre binários.

A.   Verdadeiro

B.   Falso

24: Qual é a medida de quanto duas variáveis ​​aleatórias mudam juntas?

A.   Desvio padrão binário

B.   covariância

C.   Policonvergência

D.   inércia estocástica

25: Qual destes é um exemplo de uma relação de padrão seqüencial?

A.   Usando a experiência de negócios e instinto intestinal para projetar um novo plano de piso em um supermercado

B.   Reorganizando a equipe inicial do seu time de basquete com base em uma análise do desempenho

C.   Colocando dois itens comprados com frequência um ao lado do outro na prateleira

D.   Prevendo a probabilidade de uma mochila ser comprada com base na compra de sacos de dormir e sapatos de caminhada

26: A receita anual de uma empresa internacional está correlacionada com outros atributos, como anúncio, taxa de câmbio, taxa de inflação etc. com esses valores (ou suas estimativas confiáveis ​​para o próximo ano) a empresa deve calcular sua receita esperada para o próximo ano. Escolha a tarefa de mineração de dados apropriada para esse problema de negócios.

A.   Segmentação

B.   Classificação

C.   Regressão

27: Qual é a camada front -end da arquitetura de mineração de dados?

A.   Uma interface de usuário intuitiva e amigável

B.   Firewalls estabelecidos para proteger dados de fontes maliciosas

C.   O hardware projetado especificamente para armazenamento de grandes quantidades de dados

D.   A equipe de programadores que criaram o software utilizado em um determinado projeto de mineração

28: Um hiperplano é um

A.   Limite de decisão Separando classes de dados

B.   variante do algoritmo C4.5

C.   Coleção de arquivos de hipertexto vinculados

D.   condição de erro não terminante

29: Dados não coletados pela organização, como dados de um banco de dados proprietários, que são combinados com os próprios dados da organização são conhecidos como:

A.   Sobreposição

B.   Sobreajuste

C.   Barulho

D.   Data não aplicável

30: Quais destes não são considerados fatores de dados internos?

A.   Preço

B.   Crise econômica

C.   Habilidades da equipe

D.   Posicionamento de produto

31: Qual técnica de mineração de dados organiza conjuntos de dados em grupos predefinidos?

A.   Padronização seqüencial

B.   Clustering

C.   Classificação

D.   Gamificação

32: O nível do modelo que especifica (geralmente graficamente) quais variáveis ​​são dependentes localmente uma da outra.

A.   Nível estrutural

B.   Nível qualitativo

C.   Nível primário

D.   Nível quantitativo

33: Para aumentar a confiança do seu desempenho no estado de classificação em toda a população, você deve:

A.   Diminuir o tamanho do conjunto de dados de treinamento

B.   Aumente o tamanho do conjunto de dados de treinamento

C.   Aumente o tamanho do conjunto de dados de teste

D.   Diminuir o tamanho do conjunto de dados de teste

34: O algoritmo que alimenta o mecanismo de pesquisa do Google é:

A.   Adaboost

B.   O método de Brin-Page

C.   GoogleCrawler

D.   Ranking da página

35: Na associação entre duas variáveis, qual é a diferença entre o antecedente e o consequente?

A.   O antecedente é sempre uma variável muito complexa

B.   Nada, eles são intercambiáveis

C.   O antecedente está à direita, o consequente está à esquerda.

D.   O antecedente está à esquerda, o conseqüente à direita

36: Na análise dos dados de séries temporais, o valor médio em um determinado período de tempo (geralmente algum intervalo no passado até o presente) é chamado de (n)

A.   média parcial

B.   média imparcial

C.   média composta

D.   Média móvel

37: O que é regressão?

A.   Aprender uma função que mapeia um item de dados em um dos vários grupos predefinidos.

B.   Uma expressão e em um idioma l descrevendo fatos em um subconjunto Fe de F.

C.   Uma tarefa descritiva em que se procura identificar um conjunto finito de categorias para descrever os dados.

D.   Aprender uma função que mapeia um item de dados para uma variável de previsão com valor real.

38: O que é modelagem de dependência?

A.   Um processo de várias etapas envolvendo preparação de dados, pesquisa de padrões, avaliação de conhecimento e refinamento com iteração após modificação.

B.   Aprender uma função que mapeia um item de dados em um dos vários grupos ou clusters predefinidos.

C.   O processo de encontrar um modelo que descreve dependências significativas entre variáveis ​​

D.   Uma tarefa que consiste em técnicas para estimar, a partir de dados, a função de densidade de probabilidade multi-variada de todas as variáveis/campos no banco de dados.

39: Qual destes não é uma descrições comuns de camadas?

A.   Escondido

B.   Entrada

C.   Saída

D.   Funcional

40: Sharding refere -se a:

A.   Uma medida do ruído em um conteúdo de um banco de dados

B.   Partioning um banco de dados para distribuição em diferentes servidores

C.   Acessando simultaneamente vários bancos de dados de objetos sobre SSH

D.   nenhuma das acima

41: O que é a detecção de mudança e desvio?

A.   Uma tarefa focada em descobrir as mudanças mais significativas nos dados de valores medidos ou normativos anteriormente

B.   Métodos para encontrar uma descrição compacta para um subconjunto de dados.

C.   O processo de encontrar um modelo que descreve dependências significativas entre variáveis

D.   Uma tarefa que consiste em técnicas para estimar, a partir de dados, a função de densidade de probabilidade multi-variada de todas as variáveis/campos no banco de dados.

42: Qual é o tipo de mineração de dados que impulsiona o sistema de recomendação da Amazon.com?

A.   Lógica difusa

B.   Aprendizagem de associação

C.   Detecção de anomalia

D.   Algoritmos de agrupamento

43: Qual dos seguintes algoritmos geralmente é adequado para tarefas de aprendizagem não supervisionadas?

A.   Máquina Boltzmann restrita

B.   Redes de informações sobre informações

C.   vizinho mais antigo

D.   Algoritmo K-Means

44: Qual das seguintes soluções de armazenamento é mais apropriada para um conjunto de dados semiestruturado cujos membros nem todos têm os mesmos atributos?

A.   MONGODB

B.   Sqlite

C.   Mysql

D.   Mariadb

45: Para estimar o desempenho da classificação em uma população inteira, você precisa _______

A.   (Nenhum desses)

B.   Treinamento desarticulado

C.   Conjuntos de dados de teste

D.   Disjuntar conjuntos de dados de treinamento e teste

46: Erro de generalização é uma conseqüência de

A.   Sobreajuste

B.   Análise paramétrica

C.   Underfit

D.   Chernoff pouco definido

47: Quais destes são métodos computacionais evolutivos?

A.   Algoritmos heurísticos

B.   Algoritmos de inferência bayesiana

C.   Algorítmos genéticos

D.   Algoritmos de agrupamento

48: As máquinas vetoriais de suporte têm uma vantagem sobre as redes neurais porque SVM são

A.   nenhuma das acima

B.   mais fácil de treinar via aprendizado online

C.   mais resistente à convergência mínima local

D.   paramétrico

49: Qual das alternativas a seguir não é um sistema de origem comum?

A.   Nó

B.   Fonte de seiva

C.   UDC

D.   DB Connect

50: Uma técnica que classifica cada registro em um conjunto de dados com base em uma combinação das classes do (s) K Record (s) mais semelhante a ele em um conjunto de dados histórico é:

A.   Vizinho mais próximo

B.   Regressão logística

C.   Consulta do modelo de associação

D.   Árvore de decisão