MCQ по аналитике данных (БЕСПЛАТНЫЕ вопросы с несколькими вариантами ответов)

1: Какой из следующих типов анализа временных рядов направлен на разделение периодических или циклических компонентов во временных рядах?

A. Пояснительный анализ

B. Спектральный анализ

C. Прогнозирование

D. Описательный анализ

2: Какие из следующих вариантов представляют собой правильное применение добычи правил ассоциации?

A. Каталог дизайн

B. Анализ данных корзины

C. Перекрестный маркетинг

D. Анализ потерь

E. Все вышеперечисленное

F. Ни один из вышеперечисленных

3: Какой из следующих вариантов является/является правильным приложением (ы) добычи текста?

A. Он может автоматически обрабатывать сообщения и электронные письма.

B. Он может исследовать конкурентов, ползая на их веб -сайтах.

C. Он может проанализировать открытые ответы на опрос.

D. Он может проанализировать гарантию или страховые претензии.

E. Все вышеперечисленное.

4: Что касается алгоритма нейронной сети Microsoft. Какой из следующих вариантов является типом нейрона, который представляет предсказуемые значения атрибутов для модели интеллектуального анализа данных?

A. Входной нейрон

B. Скрытый нейрон

C. Выходной нейрон

D. Ни один из вышеперечисленных

5: Какой из следующих вариантов является/является правильным в отношении алгоритма Microsoft Naive Bayes?

A. Он используется для расчета условной вероятности между входными и предсказуемыми столбцами и предполагает, что столбцы являются независимыми.

B. Он используется для выполнения автоматического выбора функций, чтобы ограничить количество значений, которые рассматриваются при построении модели.

C. Он предоставляется службами анализа сервера Microsoft SQL для использования в прогнозном моделировании.

D. Он используется для рассмотрения каждой пары значений атрибутов входных атрибутов и значений выходных атрибутов.

E. Все вышеперечисленное.

6: Какой из следующих вариантов верен в отношении техники логистической регрессии?

A. Он используется для поощрения группового эффекта в случае сильно коррелированных переменных.

B. Он используется для поиска вероятности события = успех и события = сбой.

C. Он используется для добавления и удаления предикторов по мере необходимости для каждого шага.

D. Он используется для наказания абсолютного размера коэффициентов регрессии.

7: В интеллектуальном анализе данных какой из следующих вариантов правильный в отношении алгоритма регрессии?

A. Он используется для прогнозирования одной или нескольких непрерывных числовых переменных; например. прибыль или убыток, основанные на других атрибутах в наборе данных.

B. Он используется для поиска корреляций между различными атрибутами в наборе данных.

C. Он используется для разделения данных на группы или кластеры элементов, которые имеют сходные свойства.

D. Он используется для суммирования частых последовательностей или эпизодов в данных; например. Серия событий журнала, предшествующих обслуживанию машины.

8: Согласно модели правил Ассоциации Microsoft. Какой из следующих вариантов является правильной вкладкой просмотра, которая объединяет информацию о наборах элементов и их относительной ценности?

A. Ltemsets

B. Сеть зависимости

C. Правила

D. Ни один из вышеперечисленных

9: Какое из следующих утверждений верно относительно анализа вмешательства анализа временных рядов?

A. Он используется для того, чтобы задуматься о том, может ли событие привести к изменениям во временных рядах.

B. Он используется для замыкания тренда или шаблона во временных рядах с помощью графиков или других инструментов.

C. Он широко используется в составлении бюджета. который основан на исторических тенденциях.

D. Он используется для изучения перекрестной корреляции между двумя временными рядами и их зависимостью от другого.

10: Что из следующего является правильным значением по умолчанию параметра Maximum_itemset_size, который используется с алгоритмом правил ассоциации Microsoft?

A. 10

B. 3

C. 1

D. 0,4

11: Что касается расширенной статистики, какой из следующих вариантов является правильным синтаксисом функции GLM ()?

A. GLM (формула, семейство = FamilyType (link = linkfunction), data =)

B. GLM (формула, data =, method =, control =)

C. GLM (Vector, start =. End =, частота =)

D. GLM (bootobject. conf =, type =)

12: Что из следующего является правильным синтаксисом команды, которая проверит установку пакета XLSX и загрузит библиотеку в R Workspace?

A. grepl.any (insted.packages ("xlsx")) библиотека ("xlsx")

B. Любая библиотека (grepl ("xlsx", insted.package ()))) ("xlsx")

C. any.grepl (xlsx, install.package50) | ibrary (xlsx)

D. grepl (any (insted.packages (xlsx))) | ibrary (xlsx)

13: Какие из следующих методов добычи текста можно использовать для групп документов с аналогичным содержанием?

A. Кластеризация

B. Категоризация

C. Визуализация

D. Извлечение информации

14: В Mining Data Data Sol, какой из следующих типов алгоритмов предсказывает одну или несколько дискретных переменных, основанных на других атрибутах в наборе данных?

A. Алгоритм сегментации

B. Алгоритм классификации

C. Алгоритм анализа последовательности

D. Ассоциационный алгоритм

15: В интеллектуальном анализе данных какой из следующих вариантов является правильным синтаксисом для ассоциации?

A. Совместные ассоциации [as pattern_name] анализировать {measure (s)}

B. шахтные ассоциации [as pattern_name] анализировать классификацию_аттрибу

C. шахтные ассоциации [как [pattern_name]] {Сопоставление {metApattern}}

D. Mine Association [as pattern_name] Analyze Prediction_attribute_or_dimension {set [attribute_or_dimension_i = value_i}]

16: Какой из следующих методов регрессии пытается максимизировать мощность прогнозирования с минимальным количеством переменных предикторов?

A. Пошаговая регрессия

B. Полиномиальная регрессия

C. Линейная регрессия

D. Логистическая регрессия

17: Какое из следующих утверждений верно относительно предсказуемого столбца, поддерживаемого алгоритмом линейной регрессии Microsoft?

A. Он поддерживает циклические типы контента и таблицы.

B. Он поддерживает ключ, таблицу и упорядоченные типы контента.

C. Он поддерживает непрерывные типы контента ключей и таблицы.

D. Он поддерживает непрерывные, циклические и упорядоченные типы контента.

18: Какое из следующих утверждений верно относительно параметра прогнозирования_smothing, используемого в алгоритме временных рядов Microsoft?

A. Это указывает на то, как модель должна быть смешана для оптимизации прогнозирования.

B. Он указывает, какой алгоритм использовать для анализа и прогнозирования.

C. Он определяет числовое значение от 0 до 1, которое обнаруживает периодичность.

D. Он определяет минимальное количество временных срезов, которые необходимы для создания разделения в дереве каждого временного ряда.

19: Что из следующего является правильным значением по умолчанию для параметра нестабильности, используемого с алгоритмом временных рядов Microsoft?

A. 0,6

B. 0,1

C. 10

D. 1

20: Что касается расширенной статистики, какой из следующих вариантов верен в отношении функции Аримао?

A. Его можно использовать для получения нерешенного анализа основных компонентов.

B. Его можно использовать для получения анализа фактора максимального правдоподобия.

C. Его можно использовать для начальной загрузки модели структурного уравнения.

D. Его можно использовать для использования модели авторегрессии интегрированного скользящего среднего.

21: В добыче данных какой из следующих вариантов является правильным в отношении показателя F-оценки для поиска текста?

A. F -score = remeply - precision + (remeply x precision) / 9

B. F -score = remeple + precision - (remeply x precision) i 7

C. F-score = remept x precision / (remeply + precision) / 2

D. F -score = remeple i precision x (remeply - precision) / 5

22: Что из следующего является значением по умолчанию параметра Historical_Model_GAP, используемого в алгоритме временных рядов Microsoft?

A. 10

B. 1

C. 0

D. 5

23: Какой из следующих методов расширенной статистики используется для определения скрытых переменных, которые формируют группы?

A. Регрессивный анализ

B. Anova

C. Факторный анализ

D. Логистическая регрессия

24: В интеллектуальном анализе данных, какой из следующих вариантов правильно определяет точность, которая используется для оценки качества извлечения текста?

A. Точность: L [соответствует] n [Получено] L / L [Получено] L

B. Precision = l [Получено} u [f-score] l + l [f-score} l

C. Precision = l [remeply] / [f-scorejl x l [recali] l

D. Точность = l [f -score] x [remeplyjl - l [f - score) l

25: Какие из следующих мер по поиску текста представляют собой процент документов, которые имеют отношение к запросу и фактически были извлечены?

A. Точность

B. Отзывать

C. F-Score

D. Ни один из вышеперечисленных

26: Что из следующего является правильным значением по умолчанию параметра holdout_percentage алгоритма логистической регрессии Microsoft, который используется для определения процента случаев в рамках учебных данных, используемых для расчета ошибки удержания?

A. 200

B. 30

C. 255

D. 100

27: В расширенной статистике какое из следующих утверждений является правильным в отношении метода регрессии Дирихле?

A. Он используется для моделирования двоичных переменных.

B. Он используется для моделирования композиционных данных.

C. Он используется для моделирования переменных ранга.

D. Он используется для моделирования переменных подсчета.

28: В каком из следующих методов добычи текста анализируются термины на уровне предложения и документа?

A. Метод на основе фразы (PBM)

B. Метод на основе терминов (TBM)

C. Метод таксономии схемы (PTM)

D. Метод на основе концепции (CBM)

29: В продвинутой статистике. Какой из следующих методов регрессии используется для моделирования переменных в диапазоне (0, 1)?

A. Регрессия хребта

B. Бета -регрессия

C. Лесс регрессия

D. Изотоническая регрессия

30: Согласно алгоритму правил Ассоциации Microsoft, какой из следующих параметров определяет минимальное количество случаев, которые должны содержать набор элементов до того, как алгоритм генерирует правило?

A. Minimum_support

B. Minimum_Probobility

C. Minimum_itemset_size

D. Minimum_itemset_count

31: Согласно передовой статистике обобщенной линейной модели, что из следующего является функцией ссылки по умолчанию для семейства Гаусса?

A. (link = '’Identity")

B. (link = '’iogit")

C. (link = ‘'iog")

D. (Link = ”Inverse")

32: Согласно алгоритму правил Ассоциации Microsoft, какой из следующих параметров является функцией прогнозирования со скалярным значением в качестве типа возврата?

A. lsinnode (DMX)

B. Предиката ассоциация (DMX)

C. PredictAdjustedProbability (DMX)

D. Предсцинограмма (DMX)

33: Какой из следующих параметров является по умолчанию Clustering_Method, используемый алгоритмом кластеризации Microsoft?

A. Не шкалеруемый уп

B. Масштабируемый em

C. Масштабируемые K-средние

D. Немасштабные k-массы

34: Какой из следующих вариантов является правильным типом возврата функции прогнозирования прогнозированного прогнозирования (DMX), используемой алгоритмом логистической регрессии Microsoft?

A. Логический тип

B. Значение кластера

C. Стол

D. Скалярное значение

35: Какой из следующих вариантов является параметром алгоритма временных рядов Microsoft, который используется для управления ростом дерева решений?

A. Председатель_SMothing

B. Прогноз_метод

C. Нестабильность

D. Сложность_Пенальности

36: Какое из следующих утверждений является правильным в отношении флага не нулевого моделирования, используемого в алгоритме временных рядов Microsoft?

A. Это относится к столбцам модели майнинга.

B. Это относится к столбцам структуры добычи.

C. Это применяется как к столбцам модели добычи, так и к столбцам структуры горнодобывающей структуры.

D. Это не применяется ни к столбцам модели майнинга, ни к столбцам структуры майнинга.

37: Какой из следующих методов отбора проб используется для гетерогенных единиц вселенной, а не однородных единиц, и может быть принят только тогда, когда ее население известно?

A. Простая случайная выборка

B. Стратифицированная случайная выборка

C. Обширная выборка f

D. Отбор для квоты

38: Какое из следующих утверждений неверно относительно методов отбора проб?

A. Данные могут быть собраны быстрее в методе отбора проб.

B. Метод отбора проб предоставляет объект для удобной организации и выполнения исследовательской работы.

C. Это дешевле.

D. Для использования метода выборки не требуется специализированных знаний.

39: Какое из следующих утверждений не верно в отношении пандов?

A. Он хорошо подходит для табличных данных с гетерогенными столбцами.

B. Только помеченные данные могут быть помещены в структуру данных Pandas.

C. Он подходит для данных произвольной матрицы (гомогенно напечатанной или гетерогенной) с метками строки и столбца.

D. Заказанные и неупорядоченные (не обязательно часто часто бывают) данные о частоте) также могут быть проанализированы с помощью панд.

40: Какие из следующих фундаментальных мер, используемых для оценки качества поиска текста, представляет (ы) процент извлеченных документов, относящихся к запросу?

A. Отзывать

B. F-Score

C. Точность

D. И A, и C

41: Какие из следующих алгоритмов анализа данных применяются к базе данных, содержащей большое количество транзакций, а также изучает правила ассоциации?

A. K-средние

B. C45

C. ЭМ

D. Априори

42: Работая в среде Pylab, какой из следующих вариантов не нужно импортировать?

A. matplotlib

B. Панды

C. Numpy

D. И A, и C

43: В ассоциации добыча правил, набор предметов считается закрытым в какой из следующих ситуаций?

A. Когда все его непосредственные суперсеты оказывают ту же поддержку, что и элементы.

B. Когда ни одна из его непосредственных подмножеств не имеет той же поддержки, что и набор элементов.

C. Когда все его непосредственные подмножества имеют такую же поддержку, как и элементы.

D. Когда ни один из его непосредственных суперсет не имеет такой же поддержки, как и набор элементов.

44: Удажается, что A и B представляют собой две независимые биномиальные переменные, имеющие параметры 3114 и 2,1/4 соответственно. Найдите P (A + B 21).

A. 1/1024

B. 1023/1024

C. 11512

D. 511/512

45: Модель пакета слов используется в каком из следующих процессов добычи текста?

A. Особенности выбора

B. Текст предварительная обработка

C. Особенности поколения

D. Оба а и Б

46: Для группы из 12 студентов сумма квадратов различий в их рядах для науки и математики дается как 60. На основании данной информации. Найдите значение коэффициента ранговой корреляции.

A. 0,60

B. 0,79

C. 0,45

D. 0,82

47: При расчете коэффициента корреляции ранга между продажами и расходами в течение 12 лет. Разница в звании в течение года была ошибочно принята как 9 вместо 7, и в результате значение коэффициента корреляции ранга было рассчитано как 0,79. Если ошибка исправлена, то каким будет приблизительное правильное значение коэффициента корреляции ранга?

A. 0,88

B. 0,82

C. 0,95

D. 0,90

48: Какие из следующих алгоритмов кластеризации используются для разделения на основе сетки?

A. Береза

B. K-средние

C. Стинг

D. FCM

49: Дается, что на x и y есть 15 пар показаний, так что коэффициент корреляции составляет 0,87. Также предоставляется, что стандартное отклонение на 5,60. Какова будет приблизительная стандартная ошибка оценки y на x?

A. 2.5

B. 2.8

C. 3.2

D. 3.4

50: Сэм популярен за то, что он достиг цели в 6 из 12 выстрелов, тогда как Джон может поразить одну и ту же цель за 8 из 14 выстрелов. Какова будет вероятность того, что цель будет достигнута, когда они оба попробуют?

A. 11/14

B. 13/14

C. 1/14

D. 3/14

51: Что из следующего является методом выборки невыносимости?

A. Выборка суждения

B. Стратифицированная случайная выборка

C. Выборочное обследование

D. Многоступенчатая случайная выборка

52: Какое из следующих утверждений не верно относительно байесовской сети верований?

A. L1 В сети убеждений можно определить условную независимость класса между подмножествами переменных.

B. Условное распределение вероятностей VJ не может быть указано в байесовских сетях убеждений.

C. VJ Обученная байесовская сеть не может быть использована для классификации.

D. VJ Графическая модель случайных отношений для выполнения обучения обеспечивается байесовской сетью убеждений.

53: Какое из следующих утверждений верно относительно метода выборки суждения?

A. В этом методе нет возможности личного предубеждения.

B. Это более точное и надежное.

C. Он в основном используется в тех областях, где существуют почти похожие подразделения или некоторые единицы слишком важны, чтобы их можно было избавиться от выборки.

D. Это очень дорого.

54: В байсейской модели, что из нижеперечисленного является правильным представлением плотности сустава (6, x), если известно, что для данного 0 наблюдаемые данные x являются реализацией PA?

A. n (xl0) p (x)

B. n (0) p (x)

C. n (0) p (xl0)

D. nl (x) p (0lx)

55:
Какая из следующих команд используется для наблюдения за тем, как структурированный объект R? Дается, что MyData является переменной, в которой хранятся данные пользователя.

A. Библиотека (Mydata)

B. Опишите (mydata)

C. str (mydata)

D. Резюме (Mydata)

56: В каких из следующих технологий больших данных перемещение соответствующего управления данными, аналитики и отчетов о том, где находятся данные, улучшают скорость до понимания, снижают движение данных и способствуют лучшему управлению данными?

A. Поддержка Hadoop

B. Аналитика LN-памяти

C. Сетчатая вычисления

D. Обработка LN-датабазы

57: Какая из следующих команд используется для запуска интерфейса ipython в встроенном режиме Pylab и открытии ноутбука ipython в среде Pylab?

A. ipython - pylab = in | ine

B. ipython –pylab = inline -notebook

C. ipython = ноутбук - pylab.in | ine

D. Ipython Notebook –pylab = inline

58: Man Maning Data, согласно байесам ‘Теорема, какая из следующих формул представляет собой апостериорную вероятность с точки зрения предварительной вероятности?

A. P (x/h) = p (h/x) p (h)/p (x)

B. P (h/x) = p (x/h) p (h)/p (x)

C. P (h/x) = p (x/h) p (x)/p (h)

D. P (xih) = p (h/x)/p (h) p (x)

59: В интеллектуальном анализе, какое из следующих утверждений не является правильным в отношении алгоритма C45?

A. Это позволяет только один результат.

B. Алгоритм однопроходного, полученный из биномиальных пределов конверта, используется C45.

C. Он использует информационные критерии.

60: Если пользователь хочет узнать о главных ключевых словах, которые отправляют торговлю на его/ее веб -сайт, то какой из следующих сегментаций приобретения должен быть предпочтительным?

A. Рефералы Торговля

B. Органическая торговля

C. Прямая торговля

D. Социальная торговля

61: В инструменте Google Analytics, какой из следующих анализов следует выполнить, чтобы определить происхождение веб -торговли пользователем?

A. Анализ приобретения

B. Анализ аудитории

C. Анализ поведения

D. Анализ конверсии

62: Какой из следующих типов майнинга ассоциаций обнаруживает последующие последствия, которые являются общими для более чем последовательностей Minsup в базе данных последовательностей?

A. Последовательные правила

B. Общие правила ассоциации

C. Последовательный шаблон добыча

D. Теплый

63: Какой из следующих факторов отвечает за возникновение ошибок выборки?

A. Ошибки из -за неправильных статистических мер.

B. Ошибки в компиляции.

C. Обрамление неправильной анкеты.

D. Неисправное разграничение отборочных единиц.

64: В интеллектуальном анализе данных, что из следующего является правильным синтаксисом для определения отзыва, который используется для оценки качества извлечения текста?

A. Remark = l [соответствующий} u [Получено] l l l [соответствует}!

B. Remark = l [соответствующий} u [Получено] | l l {Получено] l

C. Remark = l [соответствующий} f‌l {Получено} | / l [Получено] l

D. Remark = l [соответствующий} n [Получено} l / l [AgivallantJi

65: Что из следующего является правильным R -синтаксисом, используемым для выбора определенных строк из кадры данных, на основе специфических логических критериев?

A. Выберите (DataFrameName, логическое выражение)

B. F‌ILTER (логическое выражение, DataFrameName)

C. F‌ILTER (DataFrameName, логическое выражение)

D. Выберите (логическое выражение, dataFrameName)

66: В анализе выживания какой из следующих методов используется для моделирования функции опасности на наборе переменных предикторов?

A. Sur ()

B. coxph ()

C. Surfdiff ()

D. survf‌it ()

67: Что из следующего является описательной функцией, связанной с интеллектуальным анализом данных?

A. Эволюционный анализ

B. Прогноз

C. Анализ выброса

D. Добыча ассоциаций

68: Какое из следующих утверждений не верно относительно науки о данных?

A. Он используется для превращения данных в действия.

B. Он поддерживает и поощряет переключение между дедуктивными и индуктивными рассуждениями.

C. Для достижения успеха. Организации должны достичь максимальной зрелости науки о данных.

D. Компании необходимо оставаться в пакете и конкурировать в будущем.

69: Какие из следующих алгоритмов кластеризации могут обрабатывать шумные данные?

A. ИЗЛЕЧИВАТЬ

B. КАМЕНЬ

C. Береза

D. Хамелеон

70: Какое из следующих утверждений верно относительно запроса, основанного на подходе хранилища данных?

A. Сложный интеграция и процессы фантастики требуются в соответствии с этим подходом.

B. Этот подход позволяет копировать данные. обработанный. интегрированный. аннотирован. Заранее суммировано и реструктурировано в семантическом хранилище данных.

C. Это очень экономично для запросов, которые требуют агрегаций.

D. Это значительно более эффективно для частых запросов.

71: Указано, что y является пуассонским переменным и удовлетворяет условию p (y = 4) = p (y = 5). Каковы значения среднего и стандартного отклонения Y?

A. Среднее = 3 и стандартное отклонение = /5

B. Среднее = 5 и стандартное отклонение = /3

C. Среднее = 5 и стандартное отклонение = /’5

D. Среднее = 7 и стандартное отклонение = /7

72: Какая из следующих функций используется для разложения временных рядов с аддитивным тенденцией и сезонных и нерегулярных компонентов?

A. STL0

B. tso

C. Этсо

D. Аримао

73: В интеллектуальном анализе данных какая из следующих моделей используется/используется для прогнозирования категориальных меток класса?

A. Classif‌cation Model

B. Модель прогнозирования

C. Оба а и Б

D. Ни А, ни Б

74: В каких ключевых технологиях, которые используются для извлечения стоимости бизнеса из больших данных, данные управляются как стратегическое. Основной актив с постоянным управлением процессом для анализа больших данных?

A. Управление информацией для больших данных

B. Высокопроизводительная аналитика для больших данных

C. Гибкие варианты развертывания для больших данных

75: В ассоциации добыча правил, указание на то, как часто было обнаружено правило, представлено термином, известным как уверенность. Как этот термин. уверенность. Представлено для правила, a => b?

A. conf (a => b) = supp (a u b) / supp (a)

B. conf (a => b) = supp (b) / supp (a)

C. conf (a => b) = supp (a u b) / supp (a) ‘Supp (b)

D. conf (a => b) = supp (a u b) / 1 - supp (a)

76: Для данного набора из 25 элементов коэффициент корреляции между x и y составляет 0,6. Значения арифметического среднего значения x и y составляют 14 и 18 соответственно, а значения стандартного отклонения x и y составляют 4 и 6. соответственно. Если пара (25. 18) была ошибочно взята как (18, 25). Затем найдите правильное значение коэффициента корреляции.

A. 0,31

B. 0,42

C. 0,51

D. 0,67

77: Что из следующего является правильным способом выражения нулевой гипотезы о тесте нижнего хвоста среднего значения? Дано, что UO является предполагаемой нижней границей истинной средней популяции

A. Up 5 ll

B. P0 = L1

C. По 2 р

78: В интеллектуальном анализе данных какая из следующих частей дерева решений представляет собой результат теста?

A. Внутренний узел

B. Листовой узел

C. Отделение

D. Самый верхний узел

79: Какое из следующих утверждений является/является правильным в отношении дифференциатора SAS?

A. Он обеспечивает жесткий архитектурный подход.

B. Он может управлять и использовать только одну модель за раз.

C. Он уникально позиционируется, чтобы помочь организациям превратить большие данные и аналитику больших данных в бизнес -ценность.

D. Оба варианта A и C верны.

80: Что из следующего является правильным в отношении классификации данных?

A. Он ставит данные в точную и конденсированную форму.

B. Статистический анализ LL возможен для всех типов данных, кроме классифицированных данных.

C. Ii] это не позволяет сравнивать различные характеристики.

D. Это делает данные более легко понятными, устраняя ненужные детали.

81: В линейной дискриминантной функции анализа дискриминантной функции какова функция следующего метода?

A. Это генерирует джечинг -прогнозы.

B. Он используется для получения квадратичной дискриминантной функции.

C. Он печатает дискриминантные функции на основе переменных, которые центрированы, но не стандартизированы.

D. Он может отображать результаты линейной или квадратичной классификации с двумя переменными за раз.

82: В счете данных, какая из следующих моделей классификации построена Algorithm KNN?

A. Модель классификации дерева решений

B. Классификационная модель ансамбля

C. Модель классификации гиперплоскости

D. Никакая классификационная модель не построена KNN

83: В интеллектуальном анализе данных, что из следующего является правильным синтаксисом метода фольги, Foil_prune, используемого для обрезки правил для правила R? Указано, что P - количество положительных кортежей, охватываемых R, а N - количество отрицательных кортежей, покрытых R.

A. Foil_prune = p - n/p + n

B. Foil_prune = p + n/p - n

C. Foil_prune = p/n

D. Foil_prune = n/p + n

84: В тестировании гипотез. Как вы будете называть популяцией, чьи данные являются категориальными и принадлежат коллекции дискретных непересекающихся классов?

A. Моном

B. Биномиал

C. Триномиал

D. Многономиальный

85: Какие из следующих T-тестов следует выполнить, чтобы сравнить средства из двух разных групп?

A. Один образец t - тест

B. Парные образцы t - тест

C. Независимые образцы t-test

D. Дисперсионный анализ (ANOVA)

86: В ассоциации добыча правил, какое из следующих утверждений является правильным в отношении частой генерации элементов двухэтапного подхода?

A. Генерирует только один элемент, чья поддержка 2 minsup

B. Генерирует все наборы предметов, поддержка которых 5 Minsup

C. Генерирует все наборы предметов, поддержка которых 5 Minsup

D. Генерирует высокие правила доверия от каждого частых элементов

87: Пользователь может получить просмотр страниц веб -сайта с помощью какой из следующих целей веб -аналитики?

A. Страницы/Цель сессии

B. Цель продолжительности

C. Цель назначения

D. Цели события

88: Если есть некоторые данные с отсутствующими значениями, и вам необходимо прочитать помощь в функции, скажем, медиана, то что из следующего является правильным R -синтаксисом для этого?

A. ? Медиана

B. read.median0

C. #Median

D. help.median0

89: В веб -аналитике какой из следующих метрик контролируется на приборной панели электронной коммерции?

A. Страница время загрузки по браузеру

B. Общая продажа по продуктам

C. Преобразование по сообщению в блоге

D. В режиме реального времени

90: Параметрическая статистическая модель определяется как: (s, p) с p = [p6: e e 9]. Основываясь на статистических обозначениях, что из следующего является правильным методом представления?

A. e g r 0d

B. a = r2d

C. o c 2dr

D. E DRZ

91: Если уровень значения теста составляет 5%, каков будет результат теста, если получено P-значение больше 0,05?

A. Отклонить нулевую гипотезу

B. Не отвергает нулевую гипотезу

C. Принятие или отказ от нулевой гипотезы не зависит от p-значения.

92: Что из следующего является значением по умолчанию параметра hlstorlcal_model_gap, используемого в алгоритме временных рядов Microsoft?

A. 10

B. 1

C. 0

D. 5

93: Что из следующего представляет собой синтаксис DMQL, который используется для указания данных, связанных с задачей?

A. Используйте базу данных Database_name

B. Используйте хранилище Data Data_warehouse_Name

C. Database.usedatabase_name

D. dataWarehouse.usedata_warehouse_name

94: _______ уменьшает количество битов в файле, идентифицируя и устранение избыточности

A. Сжатие без потерь

B. Сжатие с потерями

C. Битовая карта

D. Визуализация данных

95: Типы данных, которые создаются программистом, известны как ________.

A. Переменные

B. Абстрактные типы данных (ADT)

C. Функции

D. Параметры

E. Ничего из этого

96: Дииго и вкусные инструменты.

A. Социальная закладка

B. Исследовать

C. Дискуссионная группа

D. Синхронная связь

97: Грязные данные ________.

A. Вирусные данные

B. Инфицированные червя данных

C. Неточные, неполные данные

D. Украденные данные

98: ______ рабочего листа определяет его внешний вид.

A. Форма

B. Формат

C. Вид

D. Записывать

99: ____ Инструменты корпуса обеспечивают поддержку этапами кодирования и реализации.

A. Горизонтальный

B. Внешний интерфейс

C. Бэк-Энд

D. Вертикальный

100: ________ Инструменты и методы обрабатывают данные и выполняют статистический анализ для понимания и обнаружения.

A. Управление данными предприятия

B. Собственные информационные системы

C. Бизнес-аналитика

D. Деловые процессы

Вопросы по аналитике данных на русском языке

Вопросы по аналитике данных на русском языке

1: Какой из следующих типов анализа временных рядов направлен на разделение периодических или циклических компонентов во временных рядах?

2: Какие из следующих вариантов представляют собой правильное применение добычи правил ассоциации?

3: Какой из следующих вариантов является/является правильным приложением (ы) добычи текста?

5: Какой из следующих вариантов является/является правильным в отношении алгоритма Microsoft Naive Bayes?

6: Какой из следующих вариантов верен в отношении техники логистической регрессии?

7: В интеллектуальном анализе данных какой из следующих вариантов правильный в отношении алгоритма регрессии?

9: Какое из следующих утверждений верно относительно анализа вмешательства анализа временных рядов?

10: Что из следующего является правильным значением по умолчанию параметра Maximum_itemset_size, который используется с алгоритмом правил ассоциации Microsoft?

11: Что касается расширенной статистики, какой из следующих вариантов является правильным синтаксисом функции GLM ()?

12: Что из следующего является правильным синтаксисом команды, которая проверит установку пакета XLSX и загрузит библиотеку в R Workspace?

13: Какие из следующих методов добычи текста можно использовать для групп документов с аналогичным содержанием?

14: В Mining Data Data Sol, какой из следующих типов алгоритмов предсказывает одну или несколько дискретных переменных, основанных на других атрибутах в наборе данных?

15: В интеллектуальном анализе данных какой из следующих вариантов является правильным синтаксисом для ассоциации?

16: Какой из следующих методов регрессии пытается максимизировать мощность прогнозирования с минимальным количеством переменных предикторов?

17: Какое из следующих утверждений верно относительно предсказуемого столбца, поддерживаемого алгоритмом линейной регрессии Microsoft?

18: Какое из следующих утверждений верно относительно параметра прогнозирования_smothing, используемого в алгоритме временных рядов Microsoft?

19: Что из следующего является правильным значением по умолчанию для параметра нестабильности, используемого с алгоритмом временных рядов Microsoft?

20: Что касается расширенной статистики, какой из следующих вариантов верен в отношении функции Аримао?

21: В добыче данных какой из следующих вариантов является правильным в отношении показателя F-оценки для поиска текста?

22: Что из следующего является значением по умолчанию параметра Historical_Model_GAP, используемого в алгоритме временных рядов Microsoft?

23: Какой из следующих методов расширенной статистики используется для определения скрытых переменных, которые формируют группы?

24: В интеллектуальном анализе данных, какой из следующих вариантов правильно определяет точность, которая используется для оценки качества извлечения текста?

25: Какие из следующих мер по поиску текста представляют собой процент документов, которые имеют отношение к запросу и фактически были извлечены?

27: В расширенной статистике какое из следующих утверждений является правильным в отношении метода регрессии Дирихле?

28: В каком из следующих методов добычи текста анализируются термины на уровне предложения и документа?

29: В продвинутой статистике. Какой из следующих методов регрессии используется для моделирования переменных в диапазоне (0, 1)?

31: Согласно передовой статистике обобщенной линейной модели, что из следующего является функцией ссылки по умолчанию для семейства Гаусса?

32: Согласно алгоритму правил Ассоциации Microsoft, какой из следующих параметров является функцией прогнозирования со скалярным значением в качестве типа возврата?

33: Какой из следующих параметров является по умолчанию Clustering_Method, используемый алгоритмом кластеризации Microsoft?

35: Какой из следующих вариантов является параметром алгоритма временных рядов Microsoft, который используется для управления ростом дерева решений?

36: Какое из следующих утверждений является правильным в отношении флага не нулевого моделирования, используемого в алгоритме временных рядов Microsoft?

38: Какое из следующих утверждений неверно относительно методов отбора проб?

39: Какое из следующих утверждений не верно в отношении пандов?

40: Какие из следующих фундаментальных мер, используемых для оценки качества поиска текста, представляет (ы) процент извлеченных документов, относящихся к запросу?

41: Какие из следующих алгоритмов анализа данных применяются к базе данных, содержащей большое количество транзакций, а также изучает правила ассоциации?

42: Работая в среде Pylab, какой из следующих вариантов не нужно импортировать?

43: В ассоциации добыча правил, набор предметов считается закрытым в какой из следующих ситуаций?

44: Удажается, что A и B представляют собой две независимые биномиальные переменные, имеющие параметры 3114 и 2,1/4 соответственно. Найдите P (A + B 21).

45: Модель пакета слов используется в каком из следующих процессов добычи текста?

48: Какие из следующих алгоритмов кластеризации используются для разделения на основе сетки?

51: Что из следующего является методом выборки невыносимости?

52: Какое из следующих утверждений не верно относительно байесовской сети верований?

53: Какое из следующих утверждений верно относительно метода выборки суждения?

57: Какая из следующих команд используется для запуска интерфейса ipython в встроенном режиме Pylab и открытии ноутбука ipython в среде Pylab?

58: Man Maning Data, согласно байесам ‘Теорема, какая из следующих формул представляет собой апостериорную вероятность с точки зрения предварительной вероятности?

59: В интеллектуальном анализе, какое из следующих утверждений не является правильным в отношении алгоритма C45?

61: В инструменте Google Analytics, какой из следующих анализов следует выполнить, чтобы определить происхождение веб -торговли пользователем?

63: Какой из следующих факторов отвечает за возникновение ошибок выборки?

65: Что из следующего является правильным R -синтаксисом, используемым для выбора определенных строк из кадры данных, на основе специфических логических критериев?

66: В анализе выживания какой из следующих методов используется для моделирования функции опасности на наборе переменных предикторов?

67: Что из следующего является описательной функцией, связанной с интеллектуальным анализом данных?

68: Какое из следующих утверждений не верно относительно науки о данных?

69: Какие из следующих алгоритмов кластеризации могут обрабатывать шумные данные?

70: Какое из следующих утверждений верно относительно запроса, основанного на подходе хранилища данных?

71: Указано, что y является пуассонским переменным и удовлетворяет условию p (y = 4) = p (y = 5). Каковы значения среднего и стандартного отклонения Y?

72: Какая из следующих функций используется для разложения временных рядов с аддитивным тенденцией и сезонных и нерегулярных компонентов?

73: В интеллектуальном анализе данных какая из следующих моделей используется/используется для прогнозирования категориальных меток класса?

78: В интеллектуальном анализе данных какая из следующих частей дерева решений представляет собой результат теста?

79: Какое из следующих утверждений является/является правильным в отношении дифференциатора SAS?

80: Что из следующего является правильным в отношении классификации данных?

81: В линейной дискриминантной функции анализа дискриминантной функции какова функция следующего метода?

82: В счете данных, какая из следующих моделей классификации построена Algorithm KNN?

84: В тестировании гипотез. Как вы будете называть популяцией, чьи данные являются категориальными и принадлежат коллекции дискретных непересекающихся классов?

85: Какие из следующих T-тестов следует выполнить, чтобы сравнить средства из двух разных групп?

86: В ассоциации добыча правил, какое из следующих утверждений является правильным в отношении частой генерации элементов двухэтапного подхода?

87: Пользователь может получить просмотр страниц веб -сайта с помощью какой из следующих целей веб -аналитики?

89: В веб -аналитике какой из следующих метрик контролируется на приборной панели электронной коммерции?

91: Если уровень значения теста составляет 5%, каков будет результат теста, если получено P-значение больше 0,05?

92: Что из следующего является значением по умолчанию параметра hlstorlcal_model_gap, используемого в алгоритме временных рядов Microsoft?

93: Что из следующего представляет собой синтаксис DMQL, который используется для указания данных, связанных с задачей?

94: _______ уменьшает количество битов в файле, идентифицируя и устранение избыточности

95: Типы данных, которые создаются программистом, известны как ________.

96: Дииго и вкусные инструменты.

97: Грязные данные ________.

98: ______ рабочего листа определяет его внешний вид.

99: ____ Инструменты корпуса обеспечивают поддержку этапами кодирования и реализации.

100: ________ Инструменты и методы обрабатывают данные и выполняют статистический анализ для понимания и обнаружения.

List of Вопросы по а...