Вопросы Сбор данных на русском языке

Вопросы Сбор данных на русском языке

Эти вопросы с несколькими вариантами ответов по интеллектуальному анализу данных и ответы на них помогут вам лучше понять тему интеллектуального анализа данных. Вы можете подготовиться к предстоящему экзамену или собеседованию с помощью этих 100+ MCQ Сбор данных.
Так что прокрутите вниз и начните отвечать.

1: Какая отрасль может извлечь выгоду из интеллектуального анализа данных?

A.   Все из этого

B.   Розничная торговля

C.   Производство

D.   Финансы/банковское дело

2: С какого из этих слоев начинается нейронная сеть?

A.   Выходной слой

B.   Скрытый слой

C.   Прозрачный слой

D.   Входной слой

3: Изменения в частях кода могут привести к проблеме ______________ данных.

A.   непоследовательный

B.   грязный

C.   неинтегрирован

D.   гранулированный

4: В нейронной сети, к чему относится топология?

A.   Диапазон переменных в наборе

B.   Количество используемых узлов

C.   Графическая визуализация данных

D.   Количество слоев и количество узлов в каждом слое

5: Какие из следующих алгоритмов кластеризации могут найти кластеры произвольной формы?

A.   Одноразовый

B.   DSBSCAN

C.   Оба из них

D.   Ничего из этого

6: Деревья решений способны обрабатывать пропущенные значения без использования какого -либо преобразования вмены. Правда или ложь?

A.   ЛОЖЬ

B.   Истинный

7: Алгоритм (n) _____ создает правила, которые описывают, как часто события происходят вместе.

A.   Пронзительный

B.   искусственный

C.   обрезка

D.   Ассоциативный

8: Что из следующего является действительным XML?

A.   & lt; body respong = " действительный " & gt; этот один & lt;/body & gt;

B.   & lt; value & gt; этот один из них;/value & gt;

C.   & lt; value & gt; " этот один " & lt;/value & gt;

D.   Все действительны

9: Что из следующего не является реляционной базой данных?

A.   Все вышеперечисленное

B.   Апач Кассандра

C.   Google Big Table

D.   Mongodb

10: Что такое визуализация данных?

A.   Технический термин для акта данных, хранящихся на сервере

B.   Структурированный и развитый прогноз результатов данных

C.   Визуальная интерпретация сложных отношений в многомерных данных

11: Что такое процесс KDD?

A.   Дифференциальная дешифрование

B.   Knoop-hardness, измеренный с помощью высокого воздействия

C.   Обнаружение знаний в базах данных

D.   K-Mean Data Discovery

12: Что из них не является типами аналитического программного обеспечения:

A.   Все являются действительными типами

B.   Нейронная сеть

C.   Статистический

D.   Машинное обучение

13: Правда или ложь? Экономические показатели являются внешними факторами данных.

A.   ЛОЖЬ

B.   Истинный

14: Какая из следующих дисциплин перекрывает интеллектуальный анализ данных?

A.   Все вышеперечисленное

B.   Искусственный интеллект

C.   Статистика

D.   Лингвистика

15: В прогнозирующих моделях значения или классы, которые должны быть предсказаны, называются:

A.   Зависимый

B.   Все из этого

C.   Ответ

D.   Целевые переменные

16: Вы являетесь менеджером по кредитным рискам в розничном банке. Некоторая информация о клиентах доступна для аналитики. Основываясь на этих данных, вы должны решить, что человек будет хорошим или плохим клиентом. Выберите соответствующую задачу для интеллектуального анализа данных для этих бизнес -проблем.

A.   Классификация

B.   Регрессия

C.   Сегментация

17: Элементы данных, сгруппированные в отношения, а предпочтения известны как:

A.   Предсказуемые наборы

B.   Организации

C.   Градусы подходит

D.   Кластеры

18: Что такое деревья решений?

A.   Сложные отчеты, сгенерированные квалифицированным ученым данных

B.   Иерархические размеры, которые можно создать с помощью браузера Hyper Cube

C.   Данные, не собранные организацией, такие как данные, доступные из справочника

D.   Структуры, которые генерируют правила для классификации набора данных

19: Какие популярные методы добычи данных?

A.   Модели реляционного обучения

B.   Деревья решений и правила

C.   Все из этого

D.   Вероятностные модели графической зависимости

20: Верно в отношении ложного? Архитектура спуска данных с помощью данных с муфтой в основном предназначена для систем интеллектуального анализа данных на основе памяти, которые не требуют высокой масштабируемости и высокой производительности.

A.   ЛОЖЬ

B.   Истинный

21: Что такое Crisp-DM?

A.   Дерево решений, разработанное в 1980 году, но почти полностью заменено методом CART сегодня

B.   Шестифазный метод для прогнозирования привычек покупки электронной коммерции

C.   Алгоритм линейной регрессии Microsoft

D.   Стандартный перекрестный процесс для интеллектуального анализа данных

22: Функция, используемая узлом в нейронной сети для преобразования входных данных из любого домена значений в конечный диапазон значений, известна как (n):

A.   Предшествующий

B.   Функция активации

C.   Матрица путаницы

D.   Хи-квадрат

23: Правда или ложь? Тесты в тележке всегда бинарны.

A.   Истинный

B.   ЛОЖЬ

24: Какова мера того, сколько две случайные переменные меняются вместе?

A.   Бинарное стандартное отклонение

B.   Ковариация

C.   Поликонвергенция

D.   Стохастическая инерция

25: Что из них является примером последовательной структуры схемы?

A.   Использование бизнес -опыта и инстинкта инстинкта для разработки нового плана этажа в продуктовом магазине

B.   Реорганизация стартовой состава вашей баскетбольной команды на основе анализа производительности

C.   Размещение двух часто приобретенных предметов рядом друг с другом на полке

D.   Прогнозирование вероятности приобретения рюкзака на основе покупки спальных мешков и походов .

26: Годовой доход международной компании коррелирует с другими атрибутами, такими как реклама, обменный курс, уровень инфляции и т. Д. Выберите соответствующую задачу для интеллектуального анализа данных для этой бизнес -проблемы.

A.   Сегментация

B.   Классификация

C.   Регрессия

27: Каков передний уровень архитектуры добычи данных?

A.   Интуитивно понятный и удобный пользовательский интерфейс

B.   Брандмауэры, установленные для защиты данных от вредоносных источников

C.   Оборудование, разработанное специально для хранения огромных объемов данных

D.   Команда программистов, которые разработали программное обеспечение, используемое в конкретном проекте добычи

28: Гиперплоскость - это

A.   Граница принятия решений разделяет классы данных

B.   вариант алгоритма C4.5

C.   Сбор связанных гипертекстовых файлов

D.   Непосмертное условие ошибки

29: Данные, не собранные организацией, такие как данные из проприетарной базы данных, которая сочетается с собственными данными организации, известны как:

A.   Наложение

B.   Переосмысление

C.   Шум

D.   Не применяемая дата

30: Что из них не считается внутренними факторами данных?

A.   Цена

B.   Экономические спады

C.   Навыки персонала

D.   Позиционирование продукта

31: Какой метод анализа данных организует наборы данных в предопределенные группы?

A.   Последовательный паттерн

B.   Кластеризация

C.   Классификация

D.   Геймификация

32: Уровень модели, которая указывает (часто графически), какой переменные локально зависят друг от друга.

A.   Структурный уровень

B.   Качественный уровень

C.   Первичный уровень

D.   Количественный уровень

33: Чтобы повысить доверие вашего состояния эффективности классификации во всем населении, вы должны:

A.   Уменьшить размер обучающего набора данных

B.   Увеличьте размер обучающего набора данных

C.   Увеличьте размер тестового набора данных

D.   Уменьшить размер тестового набора данных

34: Алгоритм питания поисковой системы Google:

A.   Адабуост

B.   Метод Брина

C.   Googlecrawler

D.   PageRank

35: В связи между двумя переменными, в чем разница между предшественником и последующим?

A.   Антецедент всегда очень сложная переменная

B.   Ничего, они взаимозаменяемые

C.   Антецедент находится справа, последовательно находится слева.

D.   Предшествующий находится слева, последовательно справа

36: В анализе данных временных рядов среднее значение за определенный период времени (обычно некоторый интервал в прошлом до настоящего времени) называется a (n)

A.   частичное среднее

B.   беспристрастные среды

C.   составное среднее

D.   скользящая средняя

37: Что такое регрессия?

A.   Изучение функции, которая отображает элемент данных в одну из нескольких предопределенных групп.

B.   Выражение E на языке, описывающее факты в подмножестве F.

C.   Описательная задача, в которой вы стремится определить конечный набор категорий для описания данных.

D.   Изучение функции, которая отображает элемент данных с реальной переменной прогнозирования.

38: Что такое моделирование зависимостей?

A.   Многоэтапный процесс, включающий подготовку данных, поиск шаблонов, оценку знаний и уточнение с итерацией после модификации.

B.   Изучение функции, которая отображает элемент данных в одну из нескольких предопределенных групп или кластеров.

C.   Процесс поиска модели, которая описывает значительные зависимости между переменными

D.   Задача, которая состоит из методов оценки данных, совместной многовариантной функции плотности вероятности всех переменных/полей в базе данных.

39: Что из них не является общим описанием слоев?

A.   Скрытый

B.   Вход

C.   Выход

D.   Функциональный

40: Шардинг относится к:

A.   мера шума в содержании базы данных.

B.   Принятие базы данных для распределения на разных серверах

C.   одновременно доступ к нескольким базам данных объектов через SSH

D.   ни один из вышеперечисленных

41: Что такое изменения и обнаружение отклонений?

A.   Задача, сосредоточенная на обнаружении наиболее значительных изменений в данных из ранее измеренных или нормативных значений

B.   Методы поиска компактного описания для подмножества данных.

C.   Процесс поиска модели, которая описывает значительные зависимости между переменными

D.   Задача, которая состоит из методов оценки данных, совместной многовариантной функции плотности вероятности всех переменных/полей в базе данных.

42: Каков тип интеллектуального анализа данных, который движет системой рекомендаций Amazon.com?

A.   Нечеткая логика

B.   Ассоциация обучение

C.   Обнаружение аномалии

D.   Алгоритмы кластеризации

43: Какой из следующих алгоритмов обычно подходит для неконтролируемых задач обучения?

A.   Ограниченная машина Больцмана

B.   Info-Fuzzy Networks

C.   К-ближайший сосед

D.   k-means Algorithm

44: Какое из следующих решений для хранения наиболее подходит для полуструктурированного набора данных, чьи члены не все имеют одинаковые атрибуты?

A.   Монгодб

B.   SQLite

C.   Mysql

D.   Мариадб

45: Чтобы оценить результаты классификации для всего населения, вам нужно _______

A.   (Ничего из этого)

B.   Несомненно, обучение

C.   Тестовые наборы данных

D.   Discoint Training and Test Dataets

46: Ошибка обобщения является следствием

A.   Переоценка

B.   Параметрический анализ

C.   Подразделение

D.   Плохо определенная граница Черноффа

47: Какие из них являются эволюционными вычислительными методами?

A.   Эвристические алгоритмы

B.   Байесовские алгоритмы вывода

C.   Генетические алгоритмы

D.   Алгоритмы кластеризации

48: Машины для поддержки вектор имеют преимущество перед нейронными сетями, потому что SVM

A.   ни один из вышеперечисленных

B.   легче тренироваться с помощью онлайн -обучения

C.   более сопротивляется локальной конвергенции минимумов

D.   параметрический

49: Что из следующего не является общим источником?

A.   Узел

B.   SAP Source

C.   UDC

D.   DB Connect

50: Техника, которая классифицирует каждую запись в наборе данных, основанном на комбинации классов k record (ы), наиболее похожие в историческом наборе данных:

A.   Ближайший сосед

B.   Логистическая регрессия

C.   Ассоциация модель запроса

D.   Дерево решений