Türkçe dilinde Veri Analitiği soruları

Türkçe dilinde Veri Analitiği soruları

100'den fazla veri analizi sorusunu yanıtlayarak veri analizi konularını ne kadar anladığınızı test edin.
Başlamak için aşağı kaydırın!

1: Aşağıdaki zaman serisi analizi türlerinden hangisi bir zaman serisinde periyodik veya döngüsel bileşenleri ayırmayı amaçlamaktadır?

A.   Açıklayıcı analiz

B.   Spektral analiz

C.   Tahmini

D.   Açıklayıcı analiz

2: Aşağıdaki seçeneklerden hangisi ilişkilendirme kuralı madenciliğinin doğru uygulamasını temsil eder?

A.   Katalog tasarımı

B.   Sepet Veri Analizi

C.   Çapraz pazarlama

D.   Kayıp lider analizi

E.   Yukarıdakilerin hepsi

F.   Yukarıdakilerin hiçbiri

3: Aşağıdaki seçeneklerden hangisi metin madenciliğinin doğru uygulamasıdır?

A.   Mesajları ve e -postaları otomatik olarak işleyebilir.

B.   Web sitelerini sürünerek rakipleri araştırabilir.

C.   Açık uçlu anket yanıtlarını analiz edebilir.

D.   Garanti veya sigorta taleplerini analiz edebilir.

E.   Yukarıdakilerin hepsi.

4: Microsoft sinir ağı algoritması ile ilgili olarak. Bir veri madenciliği modeli için öngörülebilir öznitelik değerlerini temsil eden nöron tipi aşağıdaki seçeneklerden hangisidir?

A.   Giriş Nöronu

B.   Gizli nöron

C.   Çıkış Nöronu

D.   Yukarıdakilerin hiçbiri

5: Microsoft Naive Bayes algoritması hakkında aşağıdaki seçeneklerden hangisi doğrudur/doğrudur?

A.   Giriş ve öngörülebilir sütunlar arasındaki koşullu olasılığı hesaplamak için kullanılır ve sütunların bağımsız olduğunu varsayar.

B.   Bir model oluştururken dikkate alınan değer sayısını sınırlamak için otomatik özellik seçimi yapmak için kullanılır.

C.   Öngörücü modellemede kullanılmak üzere Microsoft SQL Server Analiz Hizmetleri tarafından sağlanır.

D.   Her bir giriş özniteliği değerleri ve çıkış özniteliği değerleri dikkate almak için kullanılır.

E.   Yukarıdakilerin hepsi.

6: Lojistik regresyon tekniği hakkında aşağıdaki seçeneklerden hangisi doğrudur?

A.   Yüksek korelasyonlu değişkenler durumunda grup etkisini teşvik etmek için kullanılır.

B.   Olay = başarı ve olay = başarısızlık olasılığını bulmak için kullanılır.

C.   Her adım için gerektiğinde öngörücü eklemek ve çıkarmak için kullanılır.

D.   Regresyon katsayılarının mutlak büyüklüğünü cezalandırmak için kullanılır.

7: Veri madenciliğinde, regresyon algoritması hakkında aşağıdaki seçeneklerden hangisi doğrudur?

A.   Bir veya daha fazla sürekli sayısal değişkeni tahmin etmek için kullanılır; Örneğin. Bir veri kümesindeki diğer özelliklere dayanan kâr veya zarar.

B.   Bir veri kümesindeki farklı özellikler arasında korelasyon bulmak için kullanılır.

C.   Verileri benzer özelliklere sahip gruplara veya kümelere bölmek için kullanılır.

D.   Verilerdeki sık dizilerin veya atakların özetlenmesi için kullanılır; Örneğin. Makine Bakımı'ndan önceki bir dizi günlük etkinliği.

8: Microsoft Association kuralları modeline göre. Öğe kümeleri ve göreceli değerleri hakkındaki bilgileri birleştiren doğru görüntüleyici sekmesi aşağıdaki seçeneklerden hangisidir?

A.   Ltemsets

B.   Bağımlılık ağı

C.   Tüzük

D.   Yukarıdakilerin hiçbiri

9: Zaman serisi analizinin müdahale analizi tipi hakkında aşağıdaki ifadelerden hangisi doğrudur?

A.   Bir olayın bir zaman serisinde bir değişikliğe yol açıp açamayacağını düşünmek için kullanılır.

B.   Grafikler veya diğer araçların kullanımı yoluyla bir zaman serisinde bir trend veya desenle ilgili olarak kullanılır.

C.   Bütçelemede yaygın olarak kullanılır. tarihsel eğilimlere dayanmaktadır.

D.   İki zaman serisi arasındaki çapraz korelasyonu incelemek için kullanılır ve bunların bir diğerine bağımlılığı kullanılır.

10: Aşağıdakilerden hangisi Microsoft Association kuralları algoritması ile kullanılan Maximum_Itemset_Size parametresinin doğru varsayılan değeridir?

A.   10

B.   3

C.   1

D.   0.4

11: Gelişmiş istatistiklerle ilgili olarak, aşağıdaki seçeneklerden hangisi GLM () işlevinin doğru sözdizimidir?

A.   GLM (Formula, Family = FamilyType (Link = LinkFunction), Veri =)

B.   GLM (formül, veri =, yöntem =, kontrol =)

C.   GLM (vektör, start =. son =, frekans =)

D.   GLM (bootobject. conf =, type =)

12: Aşağıdakilerden hangisi, XLSX paketinin kurulumunu doğrulayacak ve kütüphaneyi R çalışma alanına yükleyecek komutun doğru sözdizimidir?

A.   Grepl.Ay (yüklemeli.Packages ("XLSX")) Kütüphane ("XLSX")

B.   herhangi bir (Grepl ("xlsx“, yüklü.package ())) kütüphanesi ("xlsx")

C.   any.grepl (xlsx, yüklü.package50) | ibrary (xlsx)

D.   grepl (herhangi bir (yüklü.packages (xlsx))) | ibrary (xlsx)

13: Benzer içeriğe sahip belge gruplarının işlenmesi için aşağıdaki metin madenciliği tekniklerinden hangisi kullanılabilir?

A.   Kümeleme

B.   Kategorizasyon

C.   Görselleştirme

D.   Bilgi Çıkarma

14: Sol Server veri madenciliğinde, aşağıdaki algoritma türlerinden hangisi bir veri kümesindeki diğer özelliklere dayanan bir veya daha fazla ayrı değişken öngörür?

A.   Segmentasyon algoritması

B.   Classif‌ation algoritması

C.   Sekans Analizi Algoritması

D.   Dernek algoritması

15: Veri madenciliğinde, aşağıdaki seçeneklerden hangisi ilişkilendirme için doğru sözdizimidir?

A.   Eşleşme İlişkileri [desen_name olarak] Analiz {Tedbir (ler)}

B.   Maden İlişkileri [Desen_name olarak] Classificing_attribute_or_Dimension analizi analiz edin

C.   Maden Dernekleri [[desen_name]] {eşleşen {metapattern}}

D.   Maden İlişkileri [Desen_name olarak] Prectiction_attribute_or_Dimension {set [attribute_or_dimension_i = value_i}]

16: Aşağıdaki regresyon tekniklerinden hangisi, minimum sayıda öngörücü değişkenle tahmin gücünü en üst düzeye çıkarmaya çalışır?

A.   Aşamalı regresyon

B.   Polinom regresyonu

C.   Doğrusal regresyon

D.   Lojistik regresyon

17: Microsoft doğrusal regresyon algoritması tarafından desteklenen öngörülebilir sütun hakkında aşağıdaki ifadelerden hangisi doğrudur?

A.   Döngüsel, anahtar ve tablo içeriği türlerini destekler.

B.   Anahtar, tablo ve sipariş edilen içerik türlerini destekler.

C.   Sürekli, anahtar ve tablo içeriği türlerini destekler.

D.   Sürekli, döngüsel ve sıralı içerik türlerini destekler.

18: Microsoft Time Serisi algoritmasında kullanılan tahmin_smoothing parametresi hakkında aşağıdaki ifadelerden hangisi doğrudur?

A.   Tahminleri optimize etmek için bir modelin nasıl karıştırılması gerektiğini belirtir.

B.   Analiz ve tahmin için hangi algoritmanın kullanılacağını belirtir.

C.   Periyodikliği tespit eden 0 ile 1 arasında sayısal bir değer belirtir.

D.   Her zaman serisi ağacında bir bölünme oluşturmak için gereken minimum zaman dilimlerini belirtir.

19: Microsoft Time Serisi algoritması ile kullanılan Instability_Sensitivity parametresi için aşağıdakilerden hangisi doğru varsayılan değerdir?

A.   0.6

B.   0.1

C.   10

D.   1

20: Gelişmiş istatistiklerle ilgili olarak, ARIMAO işlevi hakkında aşağıdaki seçeneklerden hangisi doğrudur?

A.   Çürümüşsüz bir temel bileşen analizi üretmek için kullanılabilir.

B.   Maksimum olabilirlik faktörü analizi üretmek için kullanılabilir.

C.   Yapısal eşitlik modelini önyüklemek için kullanılabilir.

D.   Otoregresif bir entegre hareketli ortalama modelin için kullanılabilir.

21: Veri madenciliğinde, metin alma için F-skoru ölçüsü hakkında aşağıdaki seçeneklerden hangisi doğrudur?

A.   F -skor = hatırlama - hassas + (geri çağırma x hassasiyet) / 9

B.   F -skor = geri çağırma + hassasiyet - (geri çağırma x hassasiyeti) i 7

C.   F-skor = geri çağırma x hassasiyeti / (hatırlama + hassasiyet) / 2

D.   F -skor = Hatırlayın I Hassas X (hatırlama - hassasiyet) / 5

22: Aşağıdakilerden hangisi Microsoft Time Serisi algoritmasında kullanılan historic_model_gap parametresinin varsayılan değeridir?

A.   10

B.   1

C.   0

D.   5

23: Grupları oluşturan gizli değişkenleri tanımlamak için aşağıdaki gelişmiş istatistik tekniklerinden hangisi kullanılır?

A.   Regresyon analizi

B.   ANOVA

C.   Faktor analizi

D.   Lojistik regresyon

24: Veri madenciliğinde, aşağıdaki seçeneklerden hangisi metin alma kalitesini değerlendirmek için kullanılan hassasiyeti doğru bir şekilde tanımlar?

A.   Hassasiyet: l [alakalı] n [alındı] l / l [Alınan] l

B.   Precision = l [Alındı} u [f-skor] l + l [f-skor} l

C.   Hassas = l [hatırlama] / [f-scorejl x l [recali] l

D.   Precision = l [f -skor] x [REVLEGJL - L [f - skor) l

25: Aşağıdaki metin alma önlemlerinden hangisi, sorgu ile ilgili olan ve gerçekten alınan belgelerin yüzdesidir?

A.   Kesinlik

B.   Hatırlamak

C.   F-skoru

D.   Yukarıdakilerin hiçbiri

26: Aşağıdakilerden hangisi, bir tutma hatasını hesaplamak için kullanılan eğitim verilerindeki vakaların yüzdesini belirlemek için kullanılan Microsoft lojistik regresyon algoritmasının Holdout_percentage parametresinin doğru varsayılan değeridir?

A.   200

B.   30

C.   255

D.   100

27: Gelişmiş istatistiklerde, Dirichlet regresyon yöntemi hakkında aşağıdaki ifadelerden hangisi doğrudur?

A.   İkili değişkenleri modellemek için kullanılır.

B.   Kompozisyon verilerini modellemek için kullanılır.

C.   Sıralama değişkenlerini modellemek için kullanılır.

D.   Sayım değişkenlerini modellemek için kullanılır.

28: Aşağıdaki metin madenciliği yöntemlerinden hangisinde, terimler cümle ve belge düzeyinde analiz edilir?

A.   İfade tabanlı yöntem (PBM)

B.   Terim Tabanlı Yöntem (TBM)

C.   Desen Taksonomi Yöntemi (PTM)

D.   Kavram Tabanlı Yöntem (CBM)

29: Gelişmiş istatistiklerde. (0, 1) aralığında değişkenleri modellemek için aşağıdaki regresyon yöntemlerinden hangisi kullanılır?

A.   Ridge regresyonu

B.   Beta regresyonu

C.   Regresyon

D.   İzotonik regresyon

30: Microsoft Association kuralları algoritmasına göre, aşağıdaki parametrelerden hangisi algoritmadan önce bir öğe kümesi içermesi gereken minimum vaka sayısını belirtir?

A.   Minimum_support

B.   Minimum_probibability

C.   Minimum_itemset_size

D.   Minimum_itemset_count

31: Gelişmiş İstatistikler Genelleştirilmiş Doğrusal Model'e göre, Gauss ailesi için varsayılan bağlantı işlevi aşağıdakilerden hangisidir?

A.   (link = '' kimlik ")

B.   (link = '' iogit ")

C.   (link = ‘'iog")

D.   (link = ”ters")

32: Microsoft Association kuralları algoritmasına göre, dönüş türü olarak skaler değeri olan tahmin işlevi aşağıdaki seçeneklerden hangisidir?

A.   lsinnode (DMX)

B.   Tahmini (DMX)

C.   Tahmini just -reprobability (DMX)

D.   Preditthistogram (DMX)

33: Microsoft kümeleme algoritması tarafından kullanılan varsayılan kümeleme_method'tan hangisidir?

A.   Ölçeklenmeyen EM

B.   Ölçeklenebilir Em

C.   Ölçeklenebilir K-Means

D.   Dönüştürülemez K-

34: Aşağıdaki seçeneklerden hangisi Microsoft lojistik regresyon algoritması tarafından kullanılan Predsthististogram (DMX) tahmin fonksiyonunun doğru dönüş tipidir?

A.   Boolean tipi

B.   Küme değeri

C.   Masa

D.   Skaler değer

35: Bir karar ağacının büyümesini kontrol etmek için kullanılan Microsoft Time Serisi algoritmasının parametresi aşağıdaki seçeneklerden hangisidir?

A.   Tahmin_smoothing

B.   Forecast_method

C.   İnstabilite_sensitivity

D.   Complexity_penalty

36: Microsoft Time Serisi algoritmasında kullanılan NOLL Modelleme bayrağı hakkında aşağıdaki ifadelerden hangisi doğrudur?

A.   Madencilik modeli sütunları için geçerlidir.

B.   Madencilik yapısı sütunları için geçerlidir.

C.   Hem madencilik modeli sütunları hem de madencilik yapısı sütunları için geçerlidir.

D.   Ne madencilik model sütunları ne de madencilik yapı sütunları için geçerli değildir.

37: Homojen birimler yerine heterojen evren birimleri için aşağıdaki örnekleme yöntemlerinden hangisi kullanılır ve sadece nüfusu bilindiğinde benimsenebilir?

A.   Basit rastgele örnekleme

B.   Tabakalı rastgele örnekleme

C.   Kapsamlı örnekleme f

D.   Kota örnekleme

38: Örnekleme yöntemleri hakkında aşağıdaki ifadelerden hangisi yanlış?

A.   Veriler bir örnekleme yönteminde daha hızlı toplanabilir.

B.   Bir örnekleme yöntemi, araştırma işini uygun bir şekilde organize etme ve yürütme tesisini sağlar.

C.   Daha ucuzdur.

D.   Bir örnekleme yöntemi kullanmak için özel bir bilgi gerekmez.

39: Pandalar hakkında aşağıdaki ifadelerden hangisi doğru değil?

A.   Heterojen olarak - tipli sütunlarla tablo verileri için çok uygundur.

B.   Yalnızca etiketli veriler bir Pandas veri yapısına yerleştirilebilir.

C.   Satır ve sütun etiketleri ile keyfi matris verileri (homojen olarak yazılmış veya heterojen) için uygundur.

D.   Sipariş edilmemiş ve sıralanmamış (mutlaka frekanslı değil) zaman serisi verileri de pandalarla analiz edilebilir.

40: Metin alma kalitesini değerlendirmek için kullanılan aşağıdaki temel önlemlerden hangisi bir sorgu ile ilgili alınan belgelerin yüzdesini temsil eder?

A.   Hatırlamak

B.   F-skoru

C.   Kesinlik

D.   Hem A hem de C

41: Aşağıdaki veri madenciliği algoritmalarından hangisi çok sayıda işlem içeren bir veritabanına uygulanır ve ayrıca ilişki kurallarını öğrenir?

A.   Kavrama

B.   C45

C.   EM

D.   Önsel

42: Bir Pylab ortamında çalışırken, aşağıdaki seçeneklerden hangisinin içe aktarılması gerekmez?

A.   matplotlib

B.   pandalar

C.   dizi

D.   Hem A hem de C

43: Dernek kuralı madenciliğinde, bir öğe kümesinin aşağıdaki durumlardan hangisinde kapatıldığı düşünülmektedir?

A.   Tüm süper kümeleri, öğe kümesiyle aynı desteğe sahip olduğunda.

B.   Hemen alt kümelerinin hiçbiri öğe kümesiyle aynı desteğe sahip olmadığında.

C.   Tüm alt kümelerinin tümü, öğe kümesiyle aynı desteğe sahip olduğunda.

D.   Hemen süper kümelerinin hiçbiri, öğe kümesiyle aynı desteğe sahip olmadığında.

44: A ve B'nin sırasıyla 3.114 ve 2,1/4 parametresine sahip iki bağımsız binom değişkeni olduğu verilmiştir. P (a + b 21) bulun.

A.   1/1024

B.   1023/1024

C.   11512

D.   511/512

45: Kelimeler torbası modeli aşağıdaki metin madenciliği süreçlerinden hangisinde kullanılır?

A.   Özellikler Seçim

B.   Metin önişleme

C.   Özellikler Nesil

D.   Hem A hem de B

46: 12 öğrenciden oluşan bir grup için, bilim ve matematik saflarındaki farklılıkların toplamı 60 olarak verilir. Verilen bilgiler temelinde. Sıralama korelasyon katsayısının değerini bulun.

A.   0.60

B.   0.79

C.   0.45

D.   0.82

47: Sıra korelasyonu hesaplanırken, satış ve harcamalar arasında 12 yıl süren bir süre için. Bir yıl boyunca rütbe farkı yanlışlıkla 7 yerine 9 olarak alınmıştır ve sonuç olarak rütbe korelasyon katsayısının değeri 0.79 olarak hesaplanmıştır. Hata düzeltilirse, o zaman rütbe korelasyon katsayısı yaklaşık doğru değeri ne olacaktır?

A.   0.88

B.   0.82

C.   0.95

D.   0.90

48: Izgara tabanlı bölümleme için aşağıdaki kümeleme algoritmalarından hangisi kullanılır?

A.   Huş ağacı

B.   Kavrama

C.   Sting

D.   FCM

49: Korelasyon katsayısı 0.87 olacak şekilde X ve Y'de 15 çift okuma bulunur. Ayrıca standart sapmanın 5.60 olduğu da verilmiştir. X üzerinde y tahmininin yaklaşık standart hatası ne olacak?

A.   2.5

B.   2.8

C.   3.2

D.   3.4

50: Sam, 12 atıştan 6'sında bir hedefe vurmak için popülerken, John 14 atıştan 8'inde aynı hedefe ulaşabilir. İkisi de denediğinde hedefin vurulma olasılığı ne olacak?

A.   11/14

B.   13/14

C.   1/14

D.   3/14