MCQ Veri Analizi (Serbest Seçim Soruları)

1: Aşağıdaki zaman serisi analizi türlerinden hangisi bir zaman serisinde periyodik veya döngüsel bileşenleri ayırmayı amaçlamaktadır?

A. Açıklayıcı analiz

B. Spektral analiz

C. Tahmini

D. Açıklayıcı analiz

2: Aşağıdaki seçeneklerden hangisi ilişkilendirme kuralı madenciliğinin doğru uygulamasını temsil eder?

A. Katalog tasarımı

B. Sepet Veri Analizi

C. Çapraz pazarlama

D. Kayıp lider analizi

E. Yukarıdakilerin hepsi

F. Yukarıdakilerin hiçbiri

3: Aşağıdaki seçeneklerden hangisi metin madenciliğinin doğru uygulamasıdır?

A. Mesajları ve e -postaları otomatik olarak işleyebilir.

B. Web sitelerini sürünerek rakipleri araştırabilir.

C. Açık uçlu anket yanıtlarını analiz edebilir.

D. Garanti veya sigorta taleplerini analiz edebilir.

E. Yukarıdakilerin hepsi.

4: Microsoft sinir ağı algoritması ile ilgili olarak. Bir veri madenciliği modeli için öngörülebilir öznitelik değerlerini temsil eden nöron tipi aşağıdaki seçeneklerden hangisidir?

A. Giriş Nöronu

B. Gizli nöron

C. Çıkış Nöronu

D. Yukarıdakilerin hiçbiri

5: Microsoft Naive Bayes algoritması hakkında aşağıdaki seçeneklerden hangisi doğrudur/doğrudur?

A. Giriş ve öngörülebilir sütunlar arasındaki koşullu olasılığı hesaplamak için kullanılır ve sütunların bağımsız olduğunu varsayar.

B. Bir model oluştururken dikkate alınan değer sayısını sınırlamak için otomatik özellik seçimi yapmak için kullanılır.

C. Öngörücü modellemede kullanılmak üzere Microsoft SQL Server Analiz Hizmetleri tarafından sağlanır.

D. Her bir giriş özniteliği değerleri ve çıkış özniteliği değerleri dikkate almak için kullanılır.

E. Yukarıdakilerin hepsi.

6: Lojistik regresyon tekniği hakkında aşağıdaki seçeneklerden hangisi doğrudur?

A. Yüksek korelasyonlu değişkenler durumunda grup etkisini teşvik etmek için kullanılır.

B. Olay = başarı ve olay = başarısızlık olasılığını bulmak için kullanılır.

C. Her adım için gerektiğinde öngörücü eklemek ve çıkarmak için kullanılır.

D. Regresyon katsayılarının mutlak büyüklüğünü cezalandırmak için kullanılır.

7: Veri madenciliğinde, regresyon algoritması hakkında aşağıdaki seçeneklerden hangisi doğrudur?

A. Bir veya daha fazla sürekli sayısal değişkeni tahmin etmek için kullanılır; Örneğin. Bir veri kümesindeki diğer özelliklere dayanan kâr veya zarar.

B. Bir veri kümesindeki farklı özellikler arasında korelasyon bulmak için kullanılır.

C. Verileri benzer özelliklere sahip gruplara veya kümelere bölmek için kullanılır.

D. Verilerdeki sık dizilerin veya atakların özetlenmesi için kullanılır; Örneğin. Makine Bakımı'ndan önceki bir dizi günlük etkinliği.

8: Microsoft Association kuralları modeline göre. Öğe kümeleri ve göreceli değerleri hakkındaki bilgileri birleştiren doğru görüntüleyici sekmesi aşağıdaki seçeneklerden hangisidir?

A. Ltemsets

B. Bağımlılık ağı

C. Tüzük

D. Yukarıdakilerin hiçbiri

9: Zaman serisi analizinin müdahale analizi tipi hakkında aşağıdaki ifadelerden hangisi doğrudur?

A. Bir olayın bir zaman serisinde bir değişikliğe yol açıp açamayacağını düşünmek için kullanılır.

B. Grafikler veya diğer araçların kullanımı yoluyla bir zaman serisinde bir trend veya desenle ilgili olarak kullanılır.

C. Bütçelemede yaygın olarak kullanılır. tarihsel eğilimlere dayanmaktadır.

D. İki zaman serisi arasındaki çapraz korelasyonu incelemek için kullanılır ve bunların bir diğerine bağımlılığı kullanılır.

10: Aşağıdakilerden hangisi Microsoft Association kuralları algoritması ile kullanılan Maximum_Itemset_Size parametresinin doğru varsayılan değeridir?

A. 10

B. 3

C. 1

D. 0.4

11: Gelişmiş istatistiklerle ilgili olarak, aşağıdaki seçeneklerden hangisi GLM () işlevinin doğru sözdizimidir?

A. GLM (Formula, Family = FamilyType (Link = LinkFunction), Veri =)

B. GLM (formül, veri =, yöntem =, kontrol =)

C. GLM (vektör, start =. son =, frekans =)

D. GLM (bootobject. conf =, type =)

12: Aşağıdakilerden hangisi, XLSX paketinin kurulumunu doğrulayacak ve kütüphaneyi R çalışma alanına yükleyecek komutun doğru sözdizimidir?

A. Grepl.Ay (yüklemeli.Packages ("XLSX")) Kütüphane ("XLSX")

B. herhangi bir (Grepl ("xlsx“, yüklü.package ())) kütüphanesi ("xlsx")

C. any.grepl (xlsx, yüklü.package50) | ibrary (xlsx)

D. grepl (herhangi bir (yüklü.packages (xlsx))) | ibrary (xlsx)

13: Benzer içeriğe sahip belge gruplarının işlenmesi için aşağıdaki metin madenciliği tekniklerinden hangisi kullanılabilir?

A. Kümeleme

B. Kategorizasyon

C. Görselleştirme

D. Bilgi Çıkarma

14: Sol Server veri madenciliğinde, aşağıdaki algoritma türlerinden hangisi bir veri kümesindeki diğer özelliklere dayanan bir veya daha fazla ayrı değişken öngörür?

A. Segmentasyon algoritması

B. Classif‌ation algoritması

C. Sekans Analizi Algoritması

D. Dernek algoritması

15: Veri madenciliğinde, aşağıdaki seçeneklerden hangisi ilişkilendirme için doğru sözdizimidir?

A. Eşleşme İlişkileri [desen_name olarak] Analiz {Tedbir (ler)}

B. Maden İlişkileri [Desen_name olarak] Classificing_attribute_or_Dimension analizi analiz edin

C. Maden Dernekleri [[desen_name]] {eşleşen {metapattern}}

D. Maden İlişkileri [Desen_name olarak] Prectiction_attribute_or_Dimension {set [attribute_or_dimension_i = value_i}]

16: Aşağıdaki regresyon tekniklerinden hangisi, minimum sayıda öngörücü değişkenle tahmin gücünü en üst düzeye çıkarmaya çalışır?

A. Aşamalı regresyon

B. Polinom regresyonu

C. Doğrusal regresyon

D. Lojistik regresyon

17: Microsoft doğrusal regresyon algoritması tarafından desteklenen öngörülebilir sütun hakkında aşağıdaki ifadelerden hangisi doğrudur?

A. Döngüsel, anahtar ve tablo içeriği türlerini destekler.

B. Anahtar, tablo ve sipariş edilen içerik türlerini destekler.

C. Sürekli, anahtar ve tablo içeriği türlerini destekler.

D. Sürekli, döngüsel ve sıralı içerik türlerini destekler.

18: Microsoft Time Serisi algoritmasında kullanılan tahmin_smoothing parametresi hakkında aşağıdaki ifadelerden hangisi doğrudur?

A. Tahminleri optimize etmek için bir modelin nasıl karıştırılması gerektiğini belirtir.

B. Analiz ve tahmin için hangi algoritmanın kullanılacağını belirtir.

C. Periyodikliği tespit eden 0 ile 1 arasında sayısal bir değer belirtir.

D. Her zaman serisi ağacında bir bölünme oluşturmak için gereken minimum zaman dilimlerini belirtir.

19: Microsoft Time Serisi algoritması ile kullanılan Instability_Sensitivity parametresi için aşağıdakilerden hangisi doğru varsayılan değerdir?

A. 0.6

B. 0.1

C. 10

D. 1

20: Gelişmiş istatistiklerle ilgili olarak, ARIMAO işlevi hakkında aşağıdaki seçeneklerden hangisi doğrudur?

A. Çürümüşsüz bir temel bileşen analizi üretmek için kullanılabilir.

B. Maksimum olabilirlik faktörü analizi üretmek için kullanılabilir.

C. Yapısal eşitlik modelini önyüklemek için kullanılabilir.

D. Otoregresif bir entegre hareketli ortalama modelin için kullanılabilir.

21: Veri madenciliğinde, metin alma için F-skoru ölçüsü hakkında aşağıdaki seçeneklerden hangisi doğrudur?

A. F -skor = hatırlama - hassas + (geri çağırma x hassasiyet) / 9

B. F -skor = geri çağırma + hassasiyet - (geri çağırma x hassasiyeti) i 7

C. F-skor = geri çağırma x hassasiyeti / (hatırlama + hassasiyet) / 2

D. F -skor = Hatırlayın I Hassas X (hatırlama - hassasiyet) / 5

22: Aşağıdakilerden hangisi Microsoft Time Serisi algoritmasında kullanılan historic_model_gap parametresinin varsayılan değeridir?

A. 10

B. 1

C. 0

D. 5

23: Grupları oluşturan gizli değişkenleri tanımlamak için aşağıdaki gelişmiş istatistik tekniklerinden hangisi kullanılır?

A. Regresyon analizi

B. ANOVA

C. Faktor analizi

D. Lojistik regresyon

24: Veri madenciliğinde, aşağıdaki seçeneklerden hangisi metin alma kalitesini değerlendirmek için kullanılan hassasiyeti doğru bir şekilde tanımlar?

A. Hassasiyet: l [alakalı] n [alındı] l / l [Alınan] l

B. Precision = l [Alındı} u [f-skor] l + l [f-skor} l

C. Hassas = l [hatırlama] / [f-scorejl x l [recali] l

D. Precision = l [f -skor] x [REVLEGJL - L [f - skor) l

25: Aşağıdaki metin alma önlemlerinden hangisi, sorgu ile ilgili olan ve gerçekten alınan belgelerin yüzdesidir?

A. Kesinlik

B. Hatırlamak

C. F-skoru

D. Yukarıdakilerin hiçbiri

26: Aşağıdakilerden hangisi, bir tutma hatasını hesaplamak için kullanılan eğitim verilerindeki vakaların yüzdesini belirlemek için kullanılan Microsoft lojistik regresyon algoritmasının Holdout_percentage parametresinin doğru varsayılan değeridir?

A. 200

B. 30

C. 255

D. 100

27: Gelişmiş istatistiklerde, Dirichlet regresyon yöntemi hakkında aşağıdaki ifadelerden hangisi doğrudur?

A. İkili değişkenleri modellemek için kullanılır.

B. Kompozisyon verilerini modellemek için kullanılır.

C. Sıralama değişkenlerini modellemek için kullanılır.

D. Sayım değişkenlerini modellemek için kullanılır.

28: Aşağıdaki metin madenciliği yöntemlerinden hangisinde, terimler cümle ve belge düzeyinde analiz edilir?

A. İfade tabanlı yöntem (PBM)

B. Terim Tabanlı Yöntem (TBM)

C. Desen Taksonomi Yöntemi (PTM)

D. Kavram Tabanlı Yöntem (CBM)

29: Gelişmiş istatistiklerde. (0, 1) aralığında değişkenleri modellemek için aşağıdaki regresyon yöntemlerinden hangisi kullanılır?

A. Ridge regresyonu

B. Beta regresyonu

C. Regresyon

D. İzotonik regresyon

30: Microsoft Association kuralları algoritmasına göre, aşağıdaki parametrelerden hangisi algoritmadan önce bir öğe kümesi içermesi gereken minimum vaka sayısını belirtir?

A. Minimum_support

B. Minimum_probibability

C. Minimum_itemset_size

D. Minimum_itemset_count

31: Gelişmiş İstatistikler Genelleştirilmiş Doğrusal Model'e göre, Gauss ailesi için varsayılan bağlantı işlevi aşağıdakilerden hangisidir?

A. (link = '' kimlik ")

B. (link = '' iogit ")

C. (link = ‘'iog")

D. (link = ”ters")

32: Microsoft Association kuralları algoritmasına göre, dönüş türü olarak skaler değeri olan tahmin işlevi aşağıdaki seçeneklerden hangisidir?

A. lsinnode (DMX)

B. Tahmini (DMX)

C. Tahmini just -reprobability (DMX)

D. Preditthistogram (DMX)

33: Microsoft kümeleme algoritması tarafından kullanılan varsayılan kümeleme_method'tan hangisidir?

A. Ölçeklenmeyen EM

B. Ölçeklenebilir Em

C. Ölçeklenebilir K-Means

D. Dönüştürülemez K-

34: Aşağıdaki seçeneklerden hangisi Microsoft lojistik regresyon algoritması tarafından kullanılan Predsthististogram (DMX) tahmin fonksiyonunun doğru dönüş tipidir?

A. Boolean tipi

B. Küme değeri

C. Masa

D. Skaler değer

35: Bir karar ağacının büyümesini kontrol etmek için kullanılan Microsoft Time Serisi algoritmasının parametresi aşağıdaki seçeneklerden hangisidir?

A. Tahmin_smoothing

B. Forecast_method

C. İnstabilite_sensitivity

D. Complexity_penalty

36: Microsoft Time Serisi algoritmasında kullanılan NOLL Modelleme bayrağı hakkında aşağıdaki ifadelerden hangisi doğrudur?

A. Madencilik modeli sütunları için geçerlidir.

B. Madencilik yapısı sütunları için geçerlidir.

C. Hem madencilik modeli sütunları hem de madencilik yapısı sütunları için geçerlidir.

D. Ne madencilik model sütunları ne de madencilik yapı sütunları için geçerli değildir.

37: Homojen birimler yerine heterojen evren birimleri için aşağıdaki örnekleme yöntemlerinden hangisi kullanılır ve sadece nüfusu bilindiğinde benimsenebilir?

A. Basit rastgele örnekleme

B. Tabakalı rastgele örnekleme

C. Kapsamlı örnekleme f

D. Kota örnekleme

38: Örnekleme yöntemleri hakkında aşağıdaki ifadelerden hangisi yanlış?

A. Veriler bir örnekleme yönteminde daha hızlı toplanabilir.

B. Bir örnekleme yöntemi, araştırma işini uygun bir şekilde organize etme ve yürütme tesisini sağlar.

C. Daha ucuzdur.

D. Bir örnekleme yöntemi kullanmak için özel bir bilgi gerekmez.

39: Pandalar hakkında aşağıdaki ifadelerden hangisi doğru değil?

A. Heterojen olarak - tipli sütunlarla tablo verileri için çok uygundur.

B. Yalnızca etiketli veriler bir Pandas veri yapısına yerleştirilebilir.

C. Satır ve sütun etiketleri ile keyfi matris verileri (homojen olarak yazılmış veya heterojen) için uygundur.

D. Sipariş edilmemiş ve sıralanmamış (mutlaka frekanslı değil) zaman serisi verileri de pandalarla analiz edilebilir.

40: Metin alma kalitesini değerlendirmek için kullanılan aşağıdaki temel önlemlerden hangisi bir sorgu ile ilgili alınan belgelerin yüzdesini temsil eder?

A. Hatırlamak

B. F-skoru

C. Kesinlik

D. Hem A hem de C

41: Aşağıdaki veri madenciliği algoritmalarından hangisi çok sayıda işlem içeren bir veritabanına uygulanır ve ayrıca ilişki kurallarını öğrenir?

A. Kavrama

B. C45

C. EM

D. Önsel

42: Bir Pylab ortamında çalışırken, aşağıdaki seçeneklerden hangisinin içe aktarılması gerekmez?

A. matplotlib

B. pandalar

C. dizi

D. Hem A hem de C

43: Dernek kuralı madenciliğinde, bir öğe kümesinin aşağıdaki durumlardan hangisinde kapatıldığı düşünülmektedir?

A. Tüm süper kümeleri, öğe kümesiyle aynı desteğe sahip olduğunda.

B. Hemen alt kümelerinin hiçbiri öğe kümesiyle aynı desteğe sahip olmadığında.

C. Tüm alt kümelerinin tümü, öğe kümesiyle aynı desteğe sahip olduğunda.

D. Hemen süper kümelerinin hiçbiri, öğe kümesiyle aynı desteğe sahip olmadığında.

44: A ve B'nin sırasıyla 3.114 ve 2,1/4 parametresine sahip iki bağımsız binom değişkeni olduğu verilmiştir. P (a + b 21) bulun.

A. 1/1024

B. 1023/1024

C. 11512

D. 511/512

45: Kelimeler torbası modeli aşağıdaki metin madenciliği süreçlerinden hangisinde kullanılır?

A. Özellikler Seçim

B. Metin önişleme

C. Özellikler Nesil

D. Hem A hem de B

46: 12 öğrenciden oluşan bir grup için, bilim ve matematik saflarındaki farklılıkların toplamı 60 olarak verilir. Verilen bilgiler temelinde. Sıralama korelasyon katsayısının değerini bulun.

A. 0.60

B. 0.79

C. 0.45

D. 0.82

47: Sıra korelasyonu hesaplanırken, satış ve harcamalar arasında 12 yıl süren bir süre için. Bir yıl boyunca rütbe farkı yanlışlıkla 7 yerine 9 olarak alınmıştır ve sonuç olarak rütbe korelasyon katsayısının değeri 0.79 olarak hesaplanmıştır. Hata düzeltilirse, o zaman rütbe korelasyon katsayısı yaklaşık doğru değeri ne olacaktır?

A. 0.88

B. 0.82

C. 0.95

D. 0.90

48: Izgara tabanlı bölümleme için aşağıdaki kümeleme algoritmalarından hangisi kullanılır?

A. Huş ağacı

B. Kavrama

C. Sting

D. FCM

49: Korelasyon katsayısı 0.87 olacak şekilde X ve Y'de 15 çift okuma bulunur. Ayrıca standart sapmanın 5.60 olduğu da verilmiştir. X üzerinde y tahmininin yaklaşık standart hatası ne olacak?

A. 2.5

B. 2.8

C. 3.2

D. 3.4

50: Sam, 12 atıştan 6'sında bir hedefe vurmak için popülerken, John 14 atıştan 8'inde aynı hedefe ulaşabilir. İkisi de denediğinde hedefin vurulma olasılığı ne olacak?

A. 11/14

B. 13/14

C. 1/14

D. 3/14

51: Olumlu olmayan bir örnekleme yöntemi aşağıdakilerden hangisidir?

A. Yargı Örnekleme

B. Tabakalı rastgele örnekleme

C. Küme örneklemesi

D. Çok aşamalı rastgele örnekleme

52: Bayes inanç ağı hakkında aşağıdaki ifadelerden hangisi doğru değildir?

A. L1 Bir inanç ağında, değişkenlerin alt kümeleri arasında koşullu bağımsızlık sınıfı tanımlanabilir.

B. VJ Ortak Koşullu Olasılık Dağılımı Bayes inanç ağları tarafından belirtilemez.

C. VJ Eğitimli bir Bayesian ağı sınıflandırma için kullanılamaz.

D. VJ Öğrenmeyi gerçekleştirmek için gündelik bir ilişkinin grafik modeli Bayesian inanç ağı tarafından sağlanmaktadır.

53: Karar örnekleme yöntemi hakkında aşağıdaki ifadelerden hangisi doğrudur?

A. Bu yöntemde kişisel önyargı olasılığı yoktur.

B. Daha doğru ve güvenilirdir.

C. Çoğunlukla neredeyse benzer birimlerin bulunduğu veya bazı birimlerin örneğin dışında bırakılamayacak kadar önemli olduğu alanlarda kullanılır.

D. Bu çok pahalı.

54: Baysian modelinde, aşağıdakilerden hangisi (6, x) eklem yoğunluğunun doğru temsilidir, eğer belirli bir 0 için gözlemlenen verilerin PA'nın gerçekleştirilmesi olduğu biliniyorsa?

A. n (xl0) p (x)

B. n (0) p (x)

C. n (0) p (xl0)

D. NL (X) P (0LX)

55:
Bir R nesnesinin yapılandırma şeklini gözlemlemek için aşağıdaki komutlardan hangisi kullanılır? MyData'nın bir kullanıcının verilerinin depolandığı bir değişken olduğu verilir.

A. Kütüphane (MyData)

B. Açıklayın (MyData)

C. Str (mydata)

D. Özet (MyData)

56: Aşağıdaki büyük veri teknolojilerinden hangisinde, ilgili veri yönetimi, analiz ve raporlama görevlerini verilerin bulunduğu yerlere taşımak, içgörü hızını artırır, veri hareketini azaltır ve daha iyi veri yönetişimi teşvik eder?

A. Hadoop için destek

B. LN-Memory Analytics

C. Izgara hesaplama

D. ln-database işleme

57: Sline Pylab modunda ipython arayüzünü başlatmak ve Pylab ortamında Ipython Notebook'u açmak için aşağıdaki komutlardan hangisi kullanılır?

A. ipython —Pylab = in | ine

B. ipython —Pylab = satır içi -Notebook

C. ipython = dizüstü bilgisayar —Pylab.in | ine

D. ipython dizüstü bilgisayar —Pylab = satır

58: LN Veri Madenciliği, Bayes ‘Teoremine göre, aşağıdaki formüllerden hangisi önceki olasılık açısından posterior olasılığı temsil eder?

A. P (x/h) = p (h/x) p (h)/p (x)

B. P (h/x) = p (x/h) p (h)/p (x)

C. P (h/x) = p (x/h) p (x)/p (h)

D. P (xih) = p (h/x)/p (h) p (x)

59: Veri madenciliğinde, aşağıdaki ifadelerden hangisi C45 algoritması hakkında doğru değildir?

A. Sadece bir sonuca izin verir.

B. C45 tarafından binom konf‌idence sınırlarından türetilen tek geçişli bir algoritma kullanılır.

C. Bilgi tabanlı kriterleri kullanır.

60: Bir kullanıcı, Traff‌ic'i web sitesine gönderen en iyi anahtar kelimeler hakkında bilgi edinmek istiyorsa, aşağıdaki edinme segmentasyonlarından hangisini tercih edilmelidir?

A. Tavsiye Traff‌ic

B. Organik Traff‌ic

C. Doğrudan Traffic‌ic

D. Sosyal Ticaret

61: Google Analytics aracında, bir kullanıcının Web Trafiği'nin kökenini tanımlamak için aşağıdaki analizlerden hangisi yapılmalıdır?

A. Edinme Analizi

B. Kitle Analizi

C. Davranış analizi

D. Dönüşüm analizi

62: Aşağıdaki ilişkilendirme madenciliği türlerinden hangisi, bir dizi veritabanındaki MinsUp dizilerinden daha fazlası için ortak olan kısıtlamaları keşfeder?

A. Sıralı Kurallar

B. Genelleştirilmiş Dernek Kuralları

C. Sıralı desen madenciliği

D. Sıcaklık

63: Örnekleme hatalarının ortaya çıkmasından aşağıdaki faktörlerden hangisi sorumludur?

A. Yanlış istatistiksel önlemlerden kaynaklanan hatalar.

B. Derlemede hatalar.

C. Yanlış bir anketin çerçevelenmesi.

D. Örnekleme birimlerinin hatalı sınırlandırılması.

64: Veri madenciliğinde, metin alma kalitesini değerlendirmek için kullanılan geri çağırma tanımlamak için aşağıdakilerden hangisi doğru sözdizimidir?

A. Hatırlama = l [alakalı} u [alındı] l l l [alakalı}!

B. Geri çağırma = l [alakalı} u [alındı] | L L {Alındı] L

C. Geri çağırma = l [alakalı} f‌l {Alındı} | / l [alındı] l

D. Geri çağırma = l [alakalı} n [Geri alındı} l / l [alacıldır

65: Bir veri çerçevesinden belirli satırları seçmek için kullanılan doğru R sözdizimi, belirli mantıksal kriterlere göre kullanılır?

A. Seç (DataFrameName, Mantıksal İfade)

B. F‌ilter (Mantıksal İfade, DataFramename)

C. F‌ilter (DataFramename, Mantıksal İfade)

D. Seç (Mantıksal İfade, DataFramename)

66: Hayatta kalma analizinde, bir dizi öngörücü değişken üzerinde tehlike işlevini modellemek için aşağıdaki yöntemlerden hangisi kullanılır?

A. Surv ()

B. Coxph ()

C. SurvDiff ()

D. Surv‌it ()

67: Veri madenciliğinde aşağıdakilerden hangisi açıklayıcı bir işlevdir?

A. Evrim analizi

B. Tahmin

C. Aykırı analiz

D. Derneklerin Madenciliği

68: Veri bilimi hakkında aşağıdaki ifadelerden hangisi doğru değildir?

A. Verileri eylemlere dönüştürmek için kullanılır.

B. Tümdengelim ve endüktif akıl yürütme arasında değişmeyi destekler ve teşvik eder.

C. Başarıya ulaşmak için. Kuruluşların maksimum veri bilimi olgunluğuna ulaşması gerekir.

D. Şirketlerin paketle kalması ve gelecekte rekabet etmesi gerekir.

69: Aşağıdaki kümeleme algoritmalarından hangisi gürültülü verileri işleyebilir?

A. TEDAVİ

B. KAYNAK

C. Huş ağacı

D. Bukalemun

70: Aşağıdaki ifadelerden hangisi sorgu odaklı veri ambarı yaklaşımı hakkında doğrudur?

A. Bu yaklaşımla karmaşık entegrasyon ve f‌ilting süreçleri gereklidir.

B. Bu yaklaşım verilerin kopyalanmasını sağlar. işlenmiş. Birleşik. Açıklamalı. Önceden bir semantik veri deposunda özetlendi ve yeniden yapılandırıldı.

C. Toplama gerektiren sorgular için çok ekonomiktir.

D. Sık sorgular için çok daha verimlidir.

71: Y'nin bir Poisson varyasyonu olduğu ve p (y = 4) = p (y = 5) durumunu tatmin eder. Y'nin ortalama ve standart sapmasının değerleri nelerdir?

A. Ortalama = 3 ve standart sapma = /5

B. Ortalama = 5 ve standart sapma = /3

C. Ortalama = 5 ve standart sapma = /’5

D. Ortalama = 7 ve standart sapma = /7

72: Bir zaman serisini katkı eğilimi ve mevsimsel ve düzensiz bileşenlerle ayrıştırmak için aşağıdaki işlevlerden hangisi kullanılır?

A. STL0

B. TSO

C. ETSO

D. Arimao

73: Veri madenciliğinde, kategorik sınıf etiketlerini tahmin etmek için aşağıdaki modellerden hangisi kullanılır/kullanılır?

A. Sınıflandırma modeli

B. Tahmin Modeli

C. Hem A hem de B

D. Ne bir ne de b

74: İş değerini büyük verilerden çıkarmak için kullanılan temel teknolojilerden hangi veriler stratejik olarak yönetilir. Büyük veri analizi için devam eden süreç kontrolüne sahip temel varlık?

A. Büyük Veri için Bilgi Yönetimi

B. Büyük veriler için yüksek performanslı analitik

C. Büyük veriler için esnek dağıtım seçenekleri

75: Dernek kuralı madenciliğinde, kuralın ne sıklıkta bulunduğunun bir göstergesi, güven olarak bilinen bir terim ile temsil edilir. Bu terim nasıl. kendinden emin. Kural için temsil edildi, a => b?

A. conf (a => b) = Supp (a u b) / sup (a)

B. conf (a => b) = Supp (b) / Supp (a)

C. conf (a => b) = Supp (a u b) / supp (a) ‘such (b)

D. conf (a => b) = Supp (a u b) / 1 - Supp (a)

76: Belirli bir 25 öğe seti için, x ve y arasındaki korelasyon katsayısı 0.6'dır. X ve Y'nin aritmetik ortalamasının değerleri sırasıyla 14 ve 18'dir ve X ve Y'nin standart sapması değerleri sırasıyla 4 ve 6'dır. Çift (25. 18) yanlış (18, 25) olarak alınmışsa. Ardından korelasyon katsayısı doğru değerini bulun.

A. 0.31

B. 0.42

C. 0.51

D. 0.67

77: Aşağıdakilerden hangisi, popülasyon ortalamasının alt kuyruk testinin sıfır hipotezini ifade etmenin doğru yoludur? UO'nun gerçek nüfus ortalamasının varsayılmış bir alt sınırı olduğu verilir.

A. 5 ll

B. P0 = L1

C. PO 2 P

78: Veri madenciliğinde, bir karar ağacının aşağıdaki bölümlerinden hangisi testin sonucunu temsil eder?

A. Dahili bir düğüm

B. Bir yaprak düğümü

C. Bir şube

D. En üst düğüm

79: Aşağıdaki ifadelerden hangisi bir SAS farklılaştırıcısı hakkında haklıdır?

A. Sert mimari yaklaşım sağlar.

B. Her seferinde yalnızca bir model yönetebilir ve kullanabilir.

C. Kuruluşların büyük verileri ve büyük veri analizlerini iş değerine dönüştürmelerine yardımcı olmak için benzersiz bir şekilde konumlandırılmıştır.

D. Hem A hem de C seçeneği doğrudur.

80: Verilerin sınıflandırılması konusunda aşağıdakilerden hangisi doğrudur?

A. Verileri hassas ve yoğunlaştırılmış bir biçimde koyar.

B. Sınıflandırılmış veriler dışında her türlü veri için istatistiksel analiz mümkündür.

C. İi] Çeşitli özellikler arasında karşılaştırmaya izin vermez.

D. Gereksiz ayrıntıları ortadan kaldırarak verileri daha kolay anlaşılabilir hale getirir.

81: Ayrımcı fonksiyon analizinin doğrusal ayrımcı fonksiyonunda, aşağıdaki yöntemin işlevi nedir?

A. Jacknifed tahminler üretir.

B. İkinci kuadratik ayrımcı fonksiyonu elde etmek için kullanılır.

C. Ortaklaşan ancak standartlaştırılmayan değişkenlere dayalı ayrımcı işlevleri yazdırır.

D. Bir seferde iki değişkenle doğrusal veya kuadratik bir sınıflandırmanın sonuçlarını gösterebilir.

82: Veri madenciliğinde, aşağıdaki sınıflandırma modellerinden hangisi KNN algoritması tarafından oluşturulur?

A. Karar Ağacı Sınıflandırma Modeli

B. Topluluk Sınıflandırma Modeli

C. Hiper -plan sınıflandırma modeli

D. Knn tarafından hiçbir sınıflandırma modeli oluşturulmaz

83: Veri madenciliğinde, aşağıdakilerden hangisi folyo yönteminin doğru sözdizimidir, foil_pune, kural r için kural budama için kullanılır? P, R ve N ile kaplı pozitif tüfek sayısı, R ile kaplı negatif tuplların sayısıdır.

A. Folyo_pune = p - n/p + n

B. Folyo_pune = p + n/p - n

C. Folyo_pune = p/n

D. Folyo_pune = n/p + n

84: Hipotez testinde. Verileri kategorik olan ve örtüşmeyen ayrı sınıflardan oluşan bir koleksiyona ait olan bir nüfusa ne denir?

A. Monomiyal

B. Binom

C. Üçlü

D. Multinomial

85: İki farklı gruptan araçları karşılaştırmak için aşağıdaki t testlerinden hangisi yapılmalıdır?

A. Bir örnek t - testi

B. Eşleştirilmiş örnekler t - Test

C. Bağımsız Örnekler T-Test

D. Varyans analizi (ANOVA)

86: Dernek kuralı madenciliğinde, iki aşamalı yaklaşımın sık sık üretimi hakkında aşağıdaki ifadelerden hangisi doğrudur?

A. Desteği 2 dakikan

B. Desteği 5 Minsup olan tüm öğe kümelerini oluşturur

C. Desteği 5 Minsup olan tüm öğe kümelerini oluşturur

D. Her sık öğe kümesinden yüksek güven kuralları oluşturur

87: Bir kullanıcı, aşağıdaki web analizi hedeflerinden hangisinin yardımıyla bir web sitesinin sayfa görüntülemelerini alabilir?

A. Sayfalar/oturum hedefi

B. Süreli hedef

C. Hedef hedef

D. Etkinlik Hedefleri

88: Eksik değerlere sahip bazı veriler varsa ve bir işlevin yardımını okumanız gerekiyorsa, medyan deyin, o zaman aşağıdakilerden hangisi bunu yapmak için doğru R sözdizimidir?

A. ? Medyan

B. Read.median0

C. #medyan

D. Yardım.median0

89: Web Analytics'te, e -ticaret gösterge panelinde aşağıdaki metriklerden hangisi izlenir?

A. Sayfa Tarayıcı tarafından Yükleme Süresi

B. Ürünlere Göre Toplam Satış

C. Blog yazısına göre dönüşüm

D. Gerçek Zamanlı Traff‌ic Kaynak

90: Parametrik istatistiksel bir model şu şekilde verilir: (s, p) p = [p6: e e 9]. İstatistiksel gösterimlere dayanarak, aşağıdakilerden hangisi A temsil etmenin doğru yöntemidir?

A. E G R 0D

B. A = R2D

C. o c 2dr

D. A E DRZ

91: Bir testin önemli seviyesi%5 ise, elde edilen p değeri 0.05'ten büyükse testin sonucu ne olacaktır?

A. Sıfır hipotezini reddet

B. Boş hipotezi reddedememe

C. Sıfır hipotezinin kabulü veya reddedilmesi P değerinden bağımsızdır.

92: Microsoft Time Serisi algoritmasında kullanılan hlstorlcal_model_gap parametresinin varsayılan değeri aşağıdakilerden hangisidir?

A. 10

B. 1

C. 0

D. 5

93: Görevle ilgili verileri belirlemek için kullanılan DMQL sözdizimi aşağıdakilerden hangisidir?

A. Veritabanı Database_Name kullanın

B. Veri Deposu Data_Warehouse_Name kullanın

C. database.useatabase_name

D. datawarehouse.useata_warehouse_name

94: _______, fazlalığı tanımlayarak ve ortadan kaldırarak bir dosyadaki bit sayısını azaltır

A. Kayıpsız Sıkıştırma

B. Kayıplı Sıkıştırma

C. Bitmap

D. Veri goruntuleme

95: Programcı tarafından oluşturulan veri türleri ________ olarak bilinir.

A. Değişkenler

B. Soyut Veri Türleri (ADT)

C. İşlevler

D. Parametreler

E. Bunlardan hiçbiri

96: Diigo ve lezzetli ________ araçlarıdır.

A. Sosyal yer imi

B. Araştırma

C. Tartışma grubu

D. Eşzamanlı iletişim

97: Kirli veriler ________.

A. Virüs ile enfekte veriler

B. Solucan ile enfekte veriler

C. Yanlış, eksik veriler

D. Çalınan veriler

98: Bir çalışma sayfasının ______ görünüşünü tanımlar.

A. Biçim

B. Biçim

C. Görüş

D. Kayıt

99: ____ Koruma araçları kodlama ve uygulama aşamalarına destek sağlar.

A. Yatay

B. Başlangıç aşaması

C. Arka uç

D. Dikey

100: ________ Araçlar ve teknikler verileri işler ve içgörü ve keşif için istatistiksel analiz yapın.

A. Kurumsal Veri Yönetişimi

B. Tescilli bilgi sistemleri

C. İş zekası

D. İş süreçleri

Türkçe dilinde Veri Analitiği soruları

Türkçe dilinde Veri Analitiği soruları

1: Aşağıdaki zaman serisi analizi türlerinden hangisi bir zaman serisinde periyodik veya döngüsel bileşenleri ayırmayı amaçlamaktadır?

2: Aşağıdaki seçeneklerden hangisi ilişkilendirme kuralı madenciliğinin doğru uygulamasını temsil eder?

3: Aşağıdaki seçeneklerden hangisi metin madenciliğinin doğru uygulamasıdır?

4: Microsoft sinir ağı algoritması ile ilgili olarak. Bir veri madenciliği modeli için öngörülebilir öznitelik değerlerini temsil eden nöron tipi aşağıdaki seçeneklerden hangisidir?

5: Microsoft Naive Bayes algoritması hakkında aşağıdaki seçeneklerden hangisi doğrudur/doğrudur?

6: Lojistik regresyon tekniği hakkında aşağıdaki seçeneklerden hangisi doğrudur?

7: Veri madenciliğinde, regresyon algoritması hakkında aşağıdaki seçeneklerden hangisi doğrudur?

8: Microsoft Association kuralları modeline göre. Öğe kümeleri ve göreceli değerleri hakkındaki bilgileri birleştiren doğru görüntüleyici sekmesi aşağıdaki seçeneklerden hangisidir?

9: Zaman serisi analizinin müdahale analizi tipi hakkında aşağıdaki ifadelerden hangisi doğrudur?

10: Aşağıdakilerden hangisi Microsoft Association kuralları algoritması ile kullanılan Maximum_Itemset_Size parametresinin doğru varsayılan değeridir?

11: Gelişmiş istatistiklerle ilgili olarak, aşağıdaki seçeneklerden hangisi GLM () işlevinin doğru sözdizimidir?

12: Aşağıdakilerden hangisi, XLSX paketinin kurulumunu doğrulayacak ve kütüphaneyi R çalışma alanına yükleyecek komutun doğru sözdizimidir?

13: Benzer içeriğe sahip belge gruplarının işlenmesi için aşağıdaki metin madenciliği tekniklerinden hangisi kullanılabilir?

14: Sol Server veri madenciliğinde, aşağıdaki algoritma türlerinden hangisi bir veri kümesindeki diğer özelliklere dayanan bir veya daha fazla ayrı değişken öngörür?

15: Veri madenciliğinde, aşağıdaki seçeneklerden hangisi ilişkilendirme için doğru sözdizimidir?

16: Aşağıdaki regresyon tekniklerinden hangisi, minimum sayıda öngörücü değişkenle tahmin gücünü en üst düzeye çıkarmaya çalışır?

17: Microsoft doğrusal regresyon algoritması tarafından desteklenen öngörülebilir sütun hakkında aşağıdaki ifadelerden hangisi doğrudur?

18: Microsoft Time Serisi algoritmasında kullanılan tahmin_smoothing parametresi hakkında aşağıdaki ifadelerden hangisi doğrudur?

19: Microsoft Time Serisi algoritması ile kullanılan Instability_Sensitivity parametresi için aşağıdakilerden hangisi doğru varsayılan değerdir?

20: Gelişmiş istatistiklerle ilgili olarak, ARIMAO işlevi hakkında aşağıdaki seçeneklerden hangisi doğrudur?

21: Veri madenciliğinde, metin alma için F-skoru ölçüsü hakkında aşağıdaki seçeneklerden hangisi doğrudur?

22: Aşağıdakilerden hangisi Microsoft Time Serisi algoritmasında kullanılan historic_model_gap parametresinin varsayılan değeridir?

23: Grupları oluşturan gizli değişkenleri tanımlamak için aşağıdaki gelişmiş istatistik tekniklerinden hangisi kullanılır?

24: Veri madenciliğinde, aşağıdaki seçeneklerden hangisi metin alma kalitesini değerlendirmek için kullanılan hassasiyeti doğru bir şekilde tanımlar?

25: Aşağıdaki metin alma önlemlerinden hangisi, sorgu ile ilgili olan ve gerçekten alınan belgelerin yüzdesidir?

26: Aşağıdakilerden hangisi, bir tutma hatasını hesaplamak için kullanılan eğitim verilerindeki vakaların yüzdesini belirlemek için kullanılan Microsoft lojistik regresyon algoritmasının Holdout_percentage parametresinin doğru varsayılan değeridir?

27: Gelişmiş istatistiklerde, Dirichlet regresyon yöntemi hakkında aşağıdaki ifadelerden hangisi doğrudur?

28: Aşağıdaki metin madenciliği yöntemlerinden hangisinde, terimler cümle ve belge düzeyinde analiz edilir?

29: Gelişmiş istatistiklerde. (0, 1) aralığında değişkenleri modellemek için aşağıdaki regresyon yöntemlerinden hangisi kullanılır?

30: Microsoft Association kuralları algoritmasına göre, aşağıdaki parametrelerden hangisi algoritmadan önce bir öğe kümesi içermesi gereken minimum vaka sayısını belirtir?

31: Gelişmiş İstatistikler Genelleştirilmiş Doğrusal Model'e göre, Gauss ailesi için varsayılan bağlantı işlevi aşağıdakilerden hangisidir?

32: Microsoft Association kuralları algoritmasına göre, dönüş türü olarak skaler değeri olan tahmin işlevi aşağıdaki seçeneklerden hangisidir?

33: Microsoft kümeleme algoritması tarafından kullanılan varsayılan kümeleme_method'tan hangisidir?

34: Aşağıdaki seçeneklerden hangisi Microsoft lojistik regresyon algoritması tarafından kullanılan Predsthististogram (DMX) tahmin fonksiyonunun doğru dönüş tipidir?

35: Bir karar ağacının büyümesini kontrol etmek için kullanılan Microsoft Time Serisi algoritmasının parametresi aşağıdaki seçeneklerden hangisidir?

36: Microsoft Time Serisi algoritmasında kullanılan NOLL Modelleme bayrağı hakkında aşağıdaki ifadelerden hangisi doğrudur?

37: Homojen birimler yerine heterojen evren birimleri için aşağıdaki örnekleme yöntemlerinden hangisi kullanılır ve sadece nüfusu bilindiğinde benimsenebilir?

38: Örnekleme yöntemleri hakkında aşağıdaki ifadelerden hangisi yanlış?

39: Pandalar hakkında aşağıdaki ifadelerden hangisi doğru değil?

40: Metin alma kalitesini değerlendirmek için kullanılan aşağıdaki temel önlemlerden hangisi bir sorgu ile ilgili alınan belgelerin yüzdesini temsil eder?

41: Aşağıdaki veri madenciliği algoritmalarından hangisi çok sayıda işlem içeren bir veritabanına uygulanır ve ayrıca ilişki kurallarını öğrenir?

42: Bir Pylab ortamında çalışırken, aşağıdaki seçeneklerden hangisinin içe aktarılması gerekmez?

43: Dernek kuralı madenciliğinde, bir öğe kümesinin aşağıdaki durumlardan hangisinde kapatıldığı düşünülmektedir?

44: A ve B'nin sırasıyla 3.114 ve 2,1/4 parametresine sahip iki bağımsız binom değişkeni olduğu verilmiştir. P (a + b 21) bulun.

45: Kelimeler torbası modeli aşağıdaki metin madenciliği süreçlerinden hangisinde kullanılır?

46: 12 öğrenciden oluşan bir grup için, bilim ve matematik saflarındaki farklılıkların toplamı 60 olarak verilir. Verilen bilgiler temelinde. Sıralama korelasyon katsayısının değerini bulun.

48: Izgara tabanlı bölümleme için aşağıdaki kümeleme algoritmalarından hangisi kullanılır?

49: Korelasyon katsayısı 0.87 olacak şekilde X ve Y'de 15 çift okuma bulunur. Ayrıca standart sapmanın 5.60 olduğu da verilmiştir. X üzerinde y tahmininin yaklaşık standart hatası ne olacak?

50: Sam, 12 atıştan 6'sında bir hedefe vurmak için popülerken, John 14 atıştan 8'inde aynı hedefe ulaşabilir. İkisi de denediğinde hedefin vurulma olasılığı ne olacak?

51: Olumlu olmayan bir örnekleme yöntemi aşağıdakilerden hangisidir?

52: Bayes inanç ağı hakkında aşağıdaki ifadelerden hangisi doğru değildir?

53: Karar örnekleme yöntemi hakkında aşağıdaki ifadelerden hangisi doğrudur?

54: Baysian modelinde, aşağıdakilerden hangisi (6, x) eklem yoğunluğunun doğru temsilidir, eğer belirli bir 0 için gözlemlenen verilerin PA'nın gerçekleştirilmesi olduğu biliniyorsa?

55: Bir R nesnesinin yapılandırma şeklini gözlemlemek için aşağıdaki komutlardan hangisi kullanılır? MyData'nın bir kullanıcının verilerinin depolandığı bir değişken olduğu verilir.

56: Aşağıdaki büyük veri teknolojilerinden hangisinde, ilgili veri yönetimi, analiz ve raporlama görevlerini verilerin bulunduğu yerlere taşımak, içgörü hızını artırır, veri hareketini azaltır ve daha iyi veri yönetişimi teşvik eder?

57: Sline Pylab modunda ipython arayüzünü başlatmak ve Pylab ortamında Ipython Notebook'u açmak için aşağıdaki komutlardan hangisi kullanılır?

58: LN Veri Madenciliği, Bayes ‘Teoremine göre, aşağıdaki formüllerden hangisi önceki olasılık açısından posterior olasılığı temsil eder?

59: Veri madenciliğinde, aşağıdaki ifadelerden hangisi C45 algoritması hakkında doğru değildir?

60: Bir kullanıcı, Traff‌ic'i web sitesine gönderen en iyi anahtar kelimeler hakkında bilgi edinmek istiyorsa, aşağıdaki edinme segmentasyonlarından hangisini tercih edilmelidir?

61: Google Analytics aracında, bir kullanıcının Web Trafiği'nin kökenini tanımlamak için aşağıdaki analizlerden hangisi yapılmalıdır?

62: Aşağıdaki ilişkilendirme madenciliği türlerinden hangisi, bir dizi veritabanındaki MinsUp dizilerinden daha fazlası için ortak olan kısıtlamaları keşfeder?

63: Örnekleme hatalarının ortaya çıkmasından aşağıdaki faktörlerden hangisi sorumludur?

64: Veri madenciliğinde, metin alma kalitesini değerlendirmek için kullanılan geri çağırma tanımlamak için aşağıdakilerden hangisi doğru sözdizimidir?

65: Bir veri çerçevesinden belirli satırları seçmek için kullanılan doğru R sözdizimi, belirli mantıksal kriterlere göre kullanılır?

66: Hayatta kalma analizinde, bir dizi öngörücü değişken üzerinde tehlike işlevini modellemek için aşağıdaki yöntemlerden hangisi kullanılır?

67: Veri madenciliğinde aşağıdakilerden hangisi açıklayıcı bir işlevdir?

68: Veri bilimi hakkında aşağıdaki ifadelerden hangisi doğru değildir?

69: Aşağıdaki kümeleme algoritmalarından hangisi gürültülü verileri işleyebilir?

70: Aşağıdaki ifadelerden hangisi sorgu odaklı veri ambarı yaklaşımı hakkında doğrudur?

71: Y'nin bir Poisson varyasyonu olduğu ve p (y = 4) = p (y = 5) durumunu tatmin eder. Y'nin ortalama ve standart sapmasının değerleri nelerdir?

72: Bir zaman serisini katkı eğilimi ve mevsimsel ve düzensiz bileşenlerle ayrıştırmak için aşağıdaki işlevlerden hangisi kullanılır?

73: Veri madenciliğinde, kategorik sınıf etiketlerini tahmin etmek için aşağıdaki modellerden hangisi kullanılır/kullanılır?

74: İş değerini büyük verilerden çıkarmak için kullanılan temel teknolojilerden hangi veriler stratejik olarak yönetilir. Büyük veri analizi için devam eden süreç kontrolüne sahip temel varlık?

75: Dernek kuralı madenciliğinde, kuralın ne sıklıkta bulunduğunun bir göstergesi, güven olarak bilinen bir terim ile temsil edilir. Bu terim nasıl. kendinden emin. Kural için temsil edildi, a => b?

77: Aşağıdakilerden hangisi, popülasyon ortalamasının alt kuyruk testinin sıfır hipotezini ifade etmenin doğru yoludur? UO'nun gerçek nüfus ortalamasının varsayılmış bir alt sınırı olduğu verilir.

78: Veri madenciliğinde, bir karar ağacının aşağıdaki bölümlerinden hangisi testin sonucunu temsil eder?

79: Aşağıdaki ifadelerden hangisi bir SAS farklılaştırıcısı hakkında haklıdır?

80: Verilerin sınıflandırılması konusunda aşağıdakilerden hangisi doğrudur?

55:
Bir R nesnesinin yapılandırma şeklini gözlemlemek için aşağıdaki komutlardan hangisi kullanılır? MyData'nın bir kullanıcının verilerinin depolandığı bir değişken olduğu verilir.