Вопросы Сбор данных на русском языке

Вопросы Сбор данных на русском языке

Эти вопросы с несколькими вариантами ответов по интеллектуальному анализу данных и ответы на них помогут вам лучше понять тему интеллектуального анализа данных. Вы можете подготовиться к предстоящему экзамену или собеседованию с помощью этих 100+ MCQ Сбор данных.
Так что прокрутите вниз и начните отвечать.

1: Какая отрасль может извлечь выгоду из интеллектуального анализа данных?

A.   Все из этого

B.   Розничная торговля

C.   Производство

D.   Финансы/банковское дело

2: С какого из этих слоев начинается нейронная сеть?

A.   Выходной слой

B.   Скрытый слой

C.   Прозрачный слой

D.   Входной слой

3: Изменения в частях кода могут привести к проблеме ______________ данных.

A.   непоследовательный

B.   грязный

C.   неинтегрирован

D.   гранулированный

4: В нейронной сети, к чему относится топология?

A.   Диапазон переменных в наборе

B.   Количество используемых узлов

C.   Графическая визуализация данных

D.   Количество слоев и количество узлов в каждом слое

5: Какие из следующих алгоритмов кластеризации могут найти кластеры произвольной формы?

A.   Одноразовый

B.   DSBSCAN

C.   Оба из них

D.   Ничего из этого

6: Деревья решений способны обрабатывать пропущенные значения без использования какого -либо преобразования вмены. Правда или ложь?

A.   ЛОЖЬ

B.   Истинный

7: Алгоритм (n) _____ создает правила, которые описывают, как часто события происходят вместе.

A.   Пронзительный

B.   искусственный

C.   обрезка

D.   Ассоциативный

8: Что из следующего является действительным XML?

A.   & lt; body respong = " действительный " & gt; этот один & lt;/body & gt;

B.   & lt; value & gt; этот один из них;/value & gt;

C.   & lt; value & gt; " этот один " & lt;/value & gt;

D.   Все действительны

9: Что из следующего не является реляционной базой данных?

A.   Все вышеперечисленное

B.   Апач Кассандра

C.   Google Big Table

D.   Mongodb

10: Что такое визуализация данных?

A.   Технический термин для акта данных, хранящихся на сервере

B.   Структурированный и развитый прогноз результатов данных

C.   Визуальная интерпретация сложных отношений в многомерных данных

11: Что такое процесс KDD?

A.   Дифференциальная дешифрование

B.   Knoop-hardness, измеренный с помощью высокого воздействия

C.   Обнаружение знаний в базах данных

D.   K-Mean Data Discovery

12: Что из них не является типами аналитического программного обеспечения:

A.   Все являются действительными типами

B.   Нейронная сеть

C.   Статистический

D.   Машинное обучение

13: Правда или ложь? Экономические показатели являются внешними факторами данных.

A.   ЛОЖЬ

B.   Истинный

14: Какая из следующих дисциплин перекрывает интеллектуальный анализ данных?

A.   Все вышеперечисленное

B.   Искусственный интеллект

C.   Статистика

D.   Лингвистика

15: В прогнозирующих моделях значения или классы, которые должны быть предсказаны, называются:

A.   Зависимый

B.   Все из этого

C.   Ответ

D.   Целевые переменные

16: Вы являетесь менеджером по кредитным рискам в розничном банке. Некоторая информация о клиентах доступна для аналитики. Основываясь на этих данных, вы должны решить, что человек будет хорошим или плохим клиентом. Выберите соответствующую задачу для интеллектуального анализа данных для этих бизнес -проблем.

A.   Классификация

B.   Регрессия

C.   Сегментация

17: Элементы данных, сгруппированные в отношения, а предпочтения известны как:

A.   Предсказуемые наборы

B.   Организации

C.   Градусы подходит

D.   Кластеры

18: Что такое деревья решений?

A.   Сложные отчеты, сгенерированные квалифицированным ученым данных

B.   Иерархические размеры, которые можно создать с помощью браузера Hyper Cube

C.   Данные, не собранные организацией, такие как данные, доступные из справочника

D.   Структуры, которые генерируют правила для классификации набора данных

19: Какие популярные методы добычи данных?

A.   Модели реляционного обучения

B.   Деревья решений и правила

C.   Все из этого

D.   Вероятностные модели графической зависимости

20: Верно в отношении ложного? Архитектура спуска данных с помощью данных с муфтой в основном предназначена для систем интеллектуального анализа данных на основе памяти, которые не требуют высокой масштабируемости и высокой производительности.

A.   ЛОЖЬ

B.   Истинный

21: Что такое Crisp-DM?

A.   Дерево решений, разработанное в 1980 году, но почти полностью заменено методом CART сегодня

B.   Шестифазный метод для прогнозирования привычек покупки электронной коммерции

C.   Алгоритм линейной регрессии Microsoft

D.   Стандартный перекрестный процесс для интеллектуального анализа данных

22: Функция, используемая узлом в нейронной сети для преобразования входных данных из любого домена значений в конечный диапазон значений, известна как (n):

A.   Предшествующий

B.   Функция активации

C.   Матрица путаницы

D.   Хи-квадрат

23: Правда или ложь? Тесты в тележке всегда бинарны.

A.   Истинный

B.   ЛОЖЬ

24: Какова мера того, сколько две случайные переменные меняются вместе?

A.   Бинарное стандартное отклонение

B.   Ковариация

C.   Поликонвергенция

D.   Стохастическая инерция

25: Что из них является примером последовательной структуры схемы?

A.   Использование бизнес -опыта и инстинкта инстинкта для разработки нового плана этажа в продуктовом магазине

B.   Реорганизация стартовой состава вашей баскетбольной команды на основе анализа производительности

C.   Размещение двух часто приобретенных предметов рядом друг с другом на полке

D.   Прогнозирование вероятности приобретения рюкзака на основе покупки спальных мешков и походов .

26: Годовой доход международной компании коррелирует с другими атрибутами, такими как реклама, обменный курс, уровень инфляции и т. Д. Выберите соответствующую задачу для интеллектуального анализа данных для этой бизнес -проблемы.

A.   Сегментация

B.   Классификация

C.   Регрессия

27: Каков передний уровень архитектуры добычи данных?

A.   Интуитивно понятный и удобный пользовательский интерфейс

B.   Брандмауэры, установленные для защиты данных от вредоносных источников

C.   Оборудование, разработанное специально для хранения огромных объемов данных

D.   Команда программистов, которые разработали программное обеспечение, используемое в конкретном проекте добычи

28: Гиперплоскость - это

A.   Граница принятия решений разделяет классы данных

B.   вариант алгоритма C4.5

C.   Сбор связанных гипертекстовых файлов

D.   Непосмертное условие ошибки

29: Данные, не собранные организацией, такие как данные из проприетарной базы данных, которая сочетается с собственными данными организации, известны как:

A.   Наложение

B.   Переосмысление

C.   Шум

D.   Не применяемая дата

30: Что из них не считается внутренними факторами данных?

A.   Цена

B.   Экономические спады

C.   Навыки персонала

D.   Позиционирование продукта

31: Какой метод анализа данных организует наборы данных в предопределенные группы?

A.   Последовательный паттерн

B.   Кластеризация

C.   Классификация

D.   Геймификация

32: Уровень модели, которая указывает (часто графически), какой переменные локально зависят друг от друга.

A.   Структурный уровень

B.   Качественный уровень

C.   Первичный уровень

D.   Количественный уровень

33: Чтобы повысить доверие вашего состояния эффективности классификации во всем населении, вы должны:

A.   Уменьшить размер обучающего набора данных

B.   Увеличьте размер обучающего набора данных

C.   Увеличьте размер тестового набора данных

D.   Уменьшить размер тестового набора данных

34: Алгоритм питания поисковой системы Google:

A.   Адабуост

B.   Метод Брина

C.   Googlecrawler

D.   PageRank

35: В связи между двумя переменными, в чем разница между предшественником и последующим?

A.   Антецедент всегда очень сложная переменная

B.   Ничего, они взаимозаменяемые

C.   Антецедент находится справа, последовательно находится слева.

D.   Предшествующий находится слева, последовательно справа

36: В анализе данных временных рядов среднее значение за определенный период времени (обычно некоторый интервал в прошлом до настоящего времени) называется a (n)

A.   частичное среднее

B.   беспристрастные среды

C.   составное среднее

D.   скользящая средняя

37: Что такое регрессия?

A.   Изучение функции, которая отображает элемент данных в одну из нескольких предопределенных групп.

B.   Выражение E на языке, описывающее факты в подмножестве F.

C.   Описательная задача, в которой вы стремится определить конечный набор категорий для описания данных.

D.   Изучение функции, которая отображает элемент данных с реальной переменной прогнозирования.

38: Что такое моделирование зависимостей?

A.   Многоэтапный процесс, включающий подготовку данных, поиск шаблонов, оценку знаний и уточнение с итерацией после модификации.

B.   Изучение функции, которая отображает элемент данных в одну из нескольких предопределенных групп или кластеров.

C.   Процесс поиска модели, которая описывает значительные зависимости между переменными

D.   Задача, которая состоит из методов оценки данных, совместной многовариантной функции плотности вероятности всех переменных/полей в базе данных.

39: Что из них не является общим описанием слоев?

A.   Скрытый

B.   Вход

C.   Выход

D.   Функциональный

40: Шардинг относится к:

A.   мера шума в содержании базы данных.

B.   Принятие базы данных для распределения на разных серверах

C.   одновременно доступ к нескольким базам данных объектов через SSH

D.   ни один из вышеперечисленных

41: Что такое изменения и обнаружение отклонений?

A.   Задача, сосредоточенная на обнаружении наиболее значительных изменений в данных из ранее измеренных или нормативных значений

B.   Методы поиска компактного описания для подмножества данных.

C.   Процесс поиска модели, которая описывает значительные зависимости между переменными

D.   Задача, которая состоит из методов оценки данных, совместной многовариантной функции плотности вероятности всех переменных/полей в базе данных.

42: Каков тип интеллектуального анализа данных, который движет системой рекомендаций Amazon.com?

A.   Нечеткая логика

B.   Ассоциация обучение

C.   Обнаружение аномалии

D.   Алгоритмы кластеризации

43: Какой из следующих алгоритмов обычно подходит для неконтролируемых задач обучения?

A.   Ограниченная машина Больцмана

B.   Info-Fuzzy Networks

C.   К-ближайший сосед

D.   k-means Algorithm

44: Какое из следующих решений для хранения наиболее подходит для полуструктурированного набора данных, чьи члены не все имеют одинаковые атрибуты?

A.   Монгодб

B.   SQLite

C.   Mysql

D.   Мариадб

45: Чтобы оценить результаты классификации для всего населения, вам нужно _______

A.   (Ничего из этого)

B.   Несомненно, обучение

C.   Тестовые наборы данных

D.   Discoint Training and Test Dataets

46: Ошибка обобщения является следствием

A.   Переоценка

B.   Параметрический анализ

C.   Подразделение

D.   Плохо определенная граница Черноффа

47: Какие из них являются эволюционными вычислительными методами?

A.   Эвристические алгоритмы

B.   Байесовские алгоритмы вывода

C.   Генетические алгоритмы

D.   Алгоритмы кластеризации

48: Машины для поддержки вектор имеют преимущество перед нейронными сетями, потому что SVM

A.   ни один из вышеперечисленных

B.   легче тренироваться с помощью онлайн -обучения

C.   более сопротивляется локальной конвергенции минимумов

D.   параметрический

49: Что из следующего не является общим источником?

A.   Узел

B.   SAP Source

C.   UDC

D.   DB Connect

50: Техника, которая классифицирует каждую запись в наборе данных, основанном на комбинации классов k record (ы), наиболее похожие в историческом наборе данных:

A.   Ближайший сосед

B.   Логистическая регрессия

C.   Ассоциация модель запроса

D.   Дерево решений

51: Какова извлечение полезных правил IF-Then из данных, основанных на статистической значимости?

A.   Предварительное отображение метода

B.   Индукция правила

C.   Нечеткое логическое приложение

D.   Динамический информационный вывод

52: Что такое классификация?

A.   Методы поиска компактного описания для подмножества данных.

B.   Изучение функции, которая отображает элемент данных в одну из нескольких предопределенных групп.

C.   Обнаруженный шаблон, который является верной для новых данных с определенной степенью уверенности, и обобщает другие данные.

D.   Описательная задача, в которой вы стремится определить конечный набор категорий для описания данных.

53: Что из следующего не является функцией хранилищ данных?

A.   Очистка грязных данных

B.   Извлечение данных

C.   Данные очистки

D.   Хранение приобретенных данных

54: Правда или ложь? Алгоритм Марса не может создавать правила.

A.   Истинный

B.   ЛОЖЬ

55: Что из следующего является наиболее подходящим для поиска самой короткой цепочки друзей, связывающих двух человек в социальном графике, которые не дружите друг с другом?

A.   k-means Algorithm

B.   Цепочки Маркова

C.   Dijkstra ' S Algorithm

D.   Нейронные сети

56: Что из перечисленного не является общей целью процесса KDD:

A.   Описание

B.   Производительность

C.   Прогноз

57: Что такое генетический алгоритм?

A.   Алгоритм поиска, который позволяет нам найти оптимальную бинарную строку, обрабатывая начальную случайную популяцию бинарных строк, выполняя такие операции, как искусственная мутация, кроссовер и отбор.

B.   Алгоритм, который оценивает, насколько хорошо конкретный шаблон (модель и ее параметры) соответствует критериям процесса KDD. Оценка точности прогнозирования (достоверность) основана на перекрестной валидации. Оценка описательного качества включает в себя прогнозирование

C.   Классический алгоритм для частых наборов элементов добыча добычи и обучения правилам ассоциации по транзакционным базам данных. Он продолжается, выявляя частые отдельные элементы в базе данных и расширяя их на более крупные и более крупные наборы элементов, пока эти элементы s

58: Что интересно?

A.   Общая мера значения шаблона, сочетание достоверности, новизны, полезности и простоты.

B.   Выражение E на языке, описывающее факты в подмножестве F.

C.   Многоэтапный процесс, включающий подготовку данных, поиск шаблонов, оценку знаний и уточнение с итерацией после модификации.

D.   Обнаруженный шаблон, который является верной для новых данных с определенной степенью уверенности, и обобщает другие данные.

59: В модели MapReduce MAP и уменьшение функций действуют непосредственно на какую структуру данных?

A.   Mysql матрицы

B.   Связанные списки

C.   Реляционные базы данных

D.   Пара ключевых значений

60: В обработке естественного языка какова роль лексического анализатора?

A.   проверяет обоснованность токена

B.   разбивает поток входных символов в токены

C.   генерирует грамматику без контекста

D.   обрабатывает дерево анализа для семантического значения

61: Что такое кластеризация?

A.   Задача, которая состоит из методов оценки данных, совместной многовариантной функции плотности вероятности всех переменных/полей в базе данных.

B.   Описательная задача, в которой вы стремится определить конечный набор категорий для описания данных.

C.   Изучение функции, которая отображает элемент данных в одну из нескольких предопределенных групп или кластеров.

D.   Процесс поиска модели, которая описывает значительные зависимости между переменными

62: СУБД уменьшает избыточность и несоответствие данных

A.   Использование словаря данных

B.   программа развязки и данные

C.   Минимизация изолированных файлов с повторными данными

D.   Обеспечение соблюдения референциальной целостности

63: В каком типе анализа обычно используется карта функций Kohonen?

A.   Описательный анализ моделирования

B.   Кластерный анализ

C.   Исследовательский анализ данных

D.   Прогнозирующий анализ

64: Какие из алгоритмов кластеризации Followng могут оптимизировать OJBective Function?

65: Конвертированная информация, чтобы предоставить информацию об исторических моделях и будущих тенденциях, известна как:

A.   Линейная регрессия

B.   Кластеризация

C.   Знание

D.   Метадата

66: Какие из следующих свойств применяются к однослойным персептронами?

A.   обратное распространение

B.   Случайная итализация весов

C.   непрерывный выход

D.   способен изучать нелинейные разделения

67: Что из следующего не является методом объединения нескольких моделей в ансамблевую модель?

A.   Голосование

B.   Укладка

C.   Усреднение

D.   Начальная загрузка

68: Что такое суммирование?

A.   Задача, сосредоточенная на обнаружении наиболее значительных изменений в данных из ранее измеренных или нормативных значений

B.   Описательная задача, в которой вы стремится определить конечный набор категорий для описания данных.

C.   Процесс поиска модели, которая описывает значительные зависимости между переменными

D.   Методы поиска компактного описания для подмножества данных.

69: " в 2% покупок в аппаратном магазине были куплены как выбор, так и лопата », - является примером:

A.   Проверка

B.   Поддерживать

C.   Контролируемое обучение

D.   Топология

70: Обычно используемая непрерывная альтернатива функции шага в многослойной выходе нейронной сети-это

A.   логистическая функция

B.   Многослойный NN не может вычислять непрерывный выход

C.   гиперболическая функция

D.   Логарифмическая функция

71: Что такое свинья

A.   Язык программирования, который позволяет Hadoop работать в качестве хранилища данных.

B.   Ничего из этого

C.   Язык программирования, который упрощает общие задачи работы с Hadoop.

72: Принимая несколько случайных образцов данных и создание классификационной модели для каждого известно как:

A.   Нечеткая выборка

B.   Биннинг

C.   Повышение

D.   Кластеризация

73: Какое выражение селектора XPath захватывает все элементы ссылки формы ' http: //example.com/profile/12345' На странице HTML, исключая все ссылки формы ' http: //example.com/casenumber/12345?

A.   // a/[содержит (@href, " профиль ")]

B.   // a/[содержит (@href, " профиль ")]/@href

C.   // href/профиль

D.   // a/profile

74: Какой из следующих алгоритмов производит деревья решений?

A.   DBSCAN

B.   Id3

C.   ни один из вышеперечисленных

D.   логистическая регрессия

75: Какое из следующих свойств является ограничением в спокойном приложении?

A.   без гражданства

B.   линейно разделяется

C.   Возвращает вывод JSON

D.   Государственное

76: Компонент распределенной файловой системы Hadoop, ответственной за хранение метаданных, называется

A.   DataNode

B.   FS Shell

C.   Dfsadmin

D.   Namenode

77: Если более одного значения встречается одинаково, данные:

A.   Многогранный

B.   Многолично

C.   Многоваринный

D.   Мультимодальный

78: Каков первый шаг на этапе понимания бизнеса?

A.   Твердо поймайте деловые цели и потребности

B.   Оцените текущую ситуацию, выяснив ресурсы, предположения, ограничения и т. Д.

C.   Создайте цели добычи данных для достижения бизнес -целей

D.   Создайте список всех соответствующих алгоритмов, которые будут применены к задаче

79: Что такое curl?

A.   Инструмент командной строки для извлечения файлов

B.   Методология классификации скрытых функций данных

C.   Часть HTTP, которая указывает разрешение на доступ

D.   Комбинаторный неконтролируемый алгоритм рекурсивного обучения

80: Уровень модели, которая указывает сильные стороны зависимостей, используя некоторые численные шкалы.

A.   Числовой уровень

B.   Первичный уровень

C.   Уровень зависимости

D.   Количественный уровень

81: Apriori является основополагающим алгоритмом для поиска частых наборов элементов, используя:

A.   Нормальные модели смеси

B.   Поколение кандидатов

C.   Методы переосмысления

D.   Ничего из этого

82: Протокол аутентификации, используемый многими значимыми веб -API, называется:

A.   Https

B.   Пг

C.   Оаут

D.   Сбл

83: Что из них не является шагом в процессе KDD?

A.   Интеграция данных

B.   Сбор данных

C.   Очистка данных

D.   Количественная оценка данных

84: Какое из следующих приложений обычно используется для классификации студентов ' выступления?

A.   Кластерный анализ

B.   Если ... тогда ... анализ

C.   Регрессивный анализ

D.   Анализ рынка

85: В любом численном наборе данных с значимым средним значением, какова минимальная доля данных, которые будут попадать в n стандартных отклонений среднего?

A.   1/n^2

B.   1/n

C.   1-1/n^2

D.   1/2n

86: Какой из следующих методов можно использовать для моделирования категориальной целевой переменной?

A.   Все вышеперечисленное

B.   Логистическая регрессия

C.   Арима

D.   Нелинейная регрессия

E.   Регрессия

87: Что из следующего не является основной фазой редуктора Hadoop?

A.   Сортировать

B.   Уменьшать

C.   Карта

D.   Перетасовать

88: Что из этого является возможной архитектурой системы интеллектуального анализа данных?

A.   Не связана

B.   Магнитная связь

C.   Транзитивная связь

D.   QuickStart Coupling

89: Правда или ложь? Искусственные нейронные сети являются линейными прогнозирующими моделями.

A.   Истинный

B.   ЛОЖЬ

90: Измеренные различия между моделью и ее прогнозами известны как:

A.   Шум

B.   Выбросы

C.   Диапазон

D.   Не применяемые данные

91: Техника на основе хэша, сокращение транзакций, порция, выборка и подсчет динамических элементов - все это примеры чего?

A.   Методы повышения эффективности алгоритма априорита

B.   Метод для повторного сканирования сканирования базы данных и проверить большой набор кандидатов с помощью соответствия шаблонов.

C.   Методы генерации частых наборов предметов без генерации кандидатов.

D.   Методы поиска компактного описания для подмножества данных.

92: Что из следующего является частью стратегии анализа данных о розничной торговле клиентами?

A.   Отзывы клиента

B.   Праздничная распродажа

C.   гарантия возврата денег

D.   карты лояльности

93: Какой метод дерева решений выполняет многоуровневые разделения при вычислении деревьев классификации?

A.   ID3 (итеративный дихотомизер 3)

B.   C4.5 Алгоритм

C.   Тележка (классификация и регрессия деревьев)

D.   Chaid (CHI Square автоматическое обнаружение взаимодействия)

94: Каково преимущество алгоритма кластеризации K-Medoids по сравнению с алгоритмом кластеризации K-Means (Lloyd)?

A.   использует итеративную уточнение

B.   Более устойчив к выбросам

C.   все вышеперечисленное

D.   представляет кластеры по центру

95: Две основные функции BI -серверов:

A.   Обработка и управление

B.   Источник и результаты

C.   Управление и доставка

D.   Приложение и доставка

96: Что из следующего не является подходящим инструментом для сбора данных с веб -сайта, который обращается к его базе данных с помощью вызовов JavaScript/Ajax?

A.   Все вышеперечисленное подходит

B.   Селен

C.   Phantomjs

D.   wget

97: Описательный подход к изучению данных, которые могут помочь определить отношения между значениями в базе данных:

A.   Прогнозирующий анализ

B.   Функциональная активация

C.   Анализ ссылок

D.   Кластеризация

98: Как вы измеряете интересность в моделях ассоциации?

A.   Измерьте дисперсию

B.   измерить актуальность

C.   точность сущности

D.   Измерить подъем

99: Что из следующего не является действительным JSON?

A.   {" Ответ " ;: " этот "#34;}

B.   {" Ответ " ;: [" этот ox oxe "]}

C.   {[" Ответ ": " этот ox ox ox oxt

D.   Все действительны

100: Где оператор веб -сайта может найти данные о своих клиентах ' IP -адреса?

A.   HTTP -запросы заголовки

B.   печенье

C.   Серверные журналы

D.   все вышеперечисленное