Türkçe dillerinde Veri Madenciliği soruları

Türkçe dillerinde Veri Madenciliği soruları

Veri madenciliği çoktan seçmeli sorular ve cevaplar, veri madenciliği konusunu daha iyi anlamanıza yardımcı olacaktır. 100'den fazla MCQ ifadesinden oluşan bu koleksiyonla bir sonraki sınavınız veya mülakatınız için hazırlanın.
Cevaplara başlamak için aşağı kaydırın.

1: Hangi endüstri veri madenciliğinden yararlanabilir?

A.   Bütün bunlar

B.   Perakende

C.   Üretme

D.   Finans/Bankacılık

2: Bu katmanlardan hangisine bir sinir ağı başlıyor?

A.   Çıktı katmanı

B.   Gizli katman

C.   Şeffaf katman

D.   Giriş Katmanı

3: Bir kodun bölümlerindeki değişiklikler ______________ verileri sorununa yol açabilir.

A.   tutarsız

B.   kirli

C.   entegre edilmemiş

D.   granül

4: Sinir ağında, topoloji neye atıfta bulunur?

A.   Bir setteki değişken aralığı

B.   Kullanılan düğüm sayısı

C.   Verilerin grafiksel görselleştirilmesi

D.   Katman sayısı ve her katmandaki düğüm sayısı

5: Aşağıdaki kümeleme algoritmalarından hangisi keyfi şekil kümelerini bulabilir?

A.   Tek link

B.   Dsbscan

C.   Bunların ikisi de

D.   Bunlardan hiçbiri

6: Karar ağaçları, herhangi bir çarpışma dönüşümü kullanmadan eksik değerleri ele alabilir. Doğru ya da yanlış?

A.   YANLIŞ

B.   Doğru

7: A (n) _____ algoritması, olayların ne sıklıkta gerçekleştiğini açıklayan kurallar oluşturur.

A.   Chaid

B.   yapay

C.   budama

D.   İlişkisel

8: Aşağıdakilerden hangisi geçerli XML?

A.   & lt; vücut cevap = " geçerli "

B.   & lt; geçerli & gt; bu & lt;/geçerli & gt;

C.   & lt; geçerli & bu bir "/lt;

D.   Hepsi geçerli

9: Aşağıdakilerden hangisi ilişkisel bir veritabanı değildir?

A.   Yukarıdakilerin hepsi

B.   Apache Cassandra

C.   Google Büyük Tablo

D.   Mongodb

10: Veri görselleştirme nedir?

A.   Bir sunucuda depolanan veri eyleminin teknik terimi

B.   Veri sonuçlarının yapılandırılmış ve geliştirilmiş bir tahmini

C.   Çok boyutlu verilerde karmaşık ilişkilerin görsel yorumu

11: KDD süreci nedir?

A.   Diferansiyel şifre çözme

B.   Yüksek etkili boyutla ölçülen knoop-sertlik

C.   Veritabanlarında bilgi keşfi

D.   K-Mean Veri Keşfi

12: Bunlardan hangisi analitik yazılım türleri değildir:

A.   Hepsi geçerli türler

B.   Sinir ağı

C.   İstatistiksel

D.   Makine öğrenme

13: Doğru ya da yanlış? Ekonomik göstergeler dış veri faktörleridir.

A.   YANLIŞ

B.   Doğru

14: Aşağıdaki disiplinlerden hangisi veri madenciliğiyle örtüşüyor?

A.   Yukarıdakilerin hepsi

B.   Yapay zeka

C.   İstatistik

D.   Dilbilim

15: Tahmini modellerde, tahmin edilecek değerler veya sınıflara aşağıdakiler denir:

A.   Bağımlı

B.   Bütün bunlar

C.   Cevap

D.   Hedef değişkenler

16: Bir perakende bankasının kredi risk yöneticisisiniz. Müşteriler hakkında bazı bilgiler analitik için mevcuttur. Bu verilere dayanarak, bir kişinin iyi veya kötü bir müşteri olacağına karar vermelisiniz. Bu iş sorunları için uygun veri madenciliği görevini seçin.

A.   Sınıflandırma

B.   Gerileme

C.   Segment

17: İlişkiler ve tercihler olarak gruplanan veri öğeleri şu şekilde bilinir:

A.   Tahmin edilebilir setler

B.   Cehri Organizasyonlar

C.   Uygun dereceler

D.   Kümeler

18: Karar ağaçları nelerdir?

A.   Nitelikli bir veri bilimcisi tarafından oluşturulan karmaşık raporlar

B.   Hiper Küp Tarayıcı ile oluşturulabilecek hiyerarşik boyutlar

C.   Bir referans kitabından elde edilebilen veriler gibi kuruluş tarafından toplanmayan veriler

D.   Bir veri kümesinin sınıflandırılması için kurallar oluşturan yapılar

19: Popüler veri madenciliği yöntemleri hangileridir?

A.   İlişkisel Öğrenme Modelleri

B.   Karar ağaçları ve kuralları

C.   Bütün bunlar

D.   Olasılıksal grafik bağımlılık modelleri

20: Yanlış için doğru mu? Gevşek birleştirme veri madenciliği mimarisi esas olarak yüksek ölçeklenebilirlik ve yüksek performans gerektirmeyen bellek tabanlı veri madenciliği sistemleri içindir.

A.   YANLIŞ

B.   Doğru

21: Crisp-dm nedir?

A.   1980'de geliştirilen bir karar ağacı, ancak neredeyse tamamen yerini bugün sepet yöntemi ile değiştirdi

B.   E-ticaret satın alma alışkanlıklarını tahmin etmek için altı fazlı bir yöntem

C.   Microsoft'un doğrusal regresyon algoritması

D.   Veri Madenciliği için Sektörler Arası Standart Süreç

22: Giriş verilerini değerlerin herhangi bir alanından sonlu bir değer aralığına dönüştürmek için bir sinir ağıdaki bir düğüm tarafından kullanılan bir işlev (n) olarak bilinir:

A.   Öncül

B.   Aktivasyon işlevi

C.   Karışıklık matrisi

D.   Yaka

23: Doğru ya da yanlış? Sepetteki testler her zaman ikilidir.

A.   Doğru

B.   YANLIŞ

24: İki rastgele değişkenin birlikte ne kadar değiştiğinin ölçüsü nedir?

A.   İkili standart sapma

B.   kovaryans

C.   Polikonverence

D.   stokastik atalet

25: Bunlardan hangisi sıralı bir örüntü ilişkisinin bir örneğidir?

A.   Bir bakkalda yeni bir kat planı tasarlamak için iş deneyimi ve bağırsak içgüdüsü kullanma

B.   Basketbol takımınızın bir performans analizine dayanarak başlangıç ​​dizisini yeniden düzenlemek

C.   Sık satın alınan iki öğeyi rafta yan yana yerleştirme

D.   Bir Tüketicinin Uyku Tulumları ve Yürüyüş Ayakkabıları Satın Alma Basacılığına dayalı bir sırt çantasının satın alınma olasılığını tahmin etmek

26: Uluslararası bir şirketin yıllık geliri, reklam, döviz kuru, içi arıza oranı vb. Gibi diğer özelliklerle ilişkilidir. Bu iş sorunu için uygun veri madenciliği görevini seçin.

A.   Segment

B.   Sınıflandırma

C.   Regresyon

27: Veri madenciliği mimarisinin ön uç katmanı nedir?

A.   Sezgisel ve kullanıcı dostu bir kullanıcı arayüzü

B.   Verileri kötü niyetli kaynaklardan korumak için kurulan güvenlik duvarları

C.   Özellikle büyük miktarlarda verilerin depolanması için tasarlanmış donanım

D.   Belirli bir madencilik projesinde kullanılan yazılımı tasarlayan programcılar ekibi

28: Hiper -plan bir

A.   Veri sınıflarını ayıran karar sınırı

B.   C4.5 algoritmasının varyantı

C.   Bağlantılı hipermetin dosyalarının koleksiyonu

D.   Sonlandırılmayan hata koşulu

29: Kuruluş tarafından tahsil edilmeyen, kuruluşun kendi verileri ile birleştirilen tescilli bir veritabanından alınan veriler gibi veriler şu şekilde bilinir:

A.   Kaplama

B.   Aşırı uyum gösterme

C.   Gürültü

D.   Uygulanamayan tarih

30: Bunlardan hangisi dahili veri faktörleri olarak kabul edilmez?

A.   Fiyat

B.   Ekonomik gerileme

C.   Personel Becerileri

D.   Ürün konumlandırma

31: Hangi veri madenciliği tekniği veri kümelerini önceden tanımlanmış gruplara düzenler?

A.   Sıralı desen

B.   Kümeleme

C.   Sınıflandırma

D.   Oyun oynamak

32: Hangi değişkenlerin yerel olarak birbirine bağlı olduğunu belirten modelin (genellikle grafiksel olarak) seviyesi.

A.   Yapısal seviye

B.   Nitel seviye

C.   Birincil seviye

D.   Nicel seviye

33: Tüm nüfus üzerindeki sınıflandırma performansınızın güvenini artırmak için:

A.   Eğitim veri kümesinin boyutunu azaltın

B.   Eğitim veri kümesinin boyutunu artırın

C.   Test veri kümesinin boyutunu artırın

D.   Test veri kümesinin boyutunu azaltın

34: Google arama motoruna güç veren algoritma:

A.   Adaboost

B.   Brin sayfası yöntemi

C.   Googlecrawler

D.   Pagerank

35: İki değişken arasındaki ilişkide, öncül ve sonuç arasındaki fark nedir?

A.   Öncül her zaman çok karmaşık bir değişkendir

B.   Hiçbir şey, değiştirilebilirler

C.   Öncül sağda, sonuç solda.

D.   Öncül solda, sağdaki sonuçta

36: Zaman serisi verilerinin analizinde, belirli bir zaman periyodu üzerindeki ortalama değer (genellikle geçmişte geçmişte bir miktar aralık) a (n) denir

A.   kısmi ortalama

B.   tarafsız ortalama

C.   bileşik ortalama

D.   hareketli ortalama

37: Regresyon nedir?

A.   Bir veri öğesini önceden tanımlanmış birkaç gruptan biriyle eşleyen bir işlev öğrenmek.

B.   Bir dilde l ifadesi l F fe alt kümesindeki gerçekleri tanımlayan bir ifade.

C.   Verileri tanımlamak için sonlu bir kategoriyi tanımlamaya çalıştığı tanımlayıcı bir görev.

D.   Bir veri öğesini gerçek değerli bir tahmin değişkeniyle eşleyen bir işlev öğrenmek.

38: Bağımlılık modellemesi nedir?

A.   Modifikasyondan sonra veri hazırlama, örüntü arama, bilgi değerlendirmesi ve yineleme ile iyileştirmeyi içeren çok aşamalı bir süreç.

B.   Bir veri öğesini önceden tanımlanmış birkaç grup veya kümeden biriyle eşleştiren bir işlev öğrenmek.

C.   Değişkenler arasında önemli bağımlılıkları tanımlayan bir model bulma süreci

D.   Verilerden, veritabanındaki tüm değişkenlerin/alanların eklem çok değişkenli olasılık yoğunluk fonksiyonunu tahmin etmek için tekniklerden oluşan bir görev.

39: Bunlardan hangisi katmanların ortak bir açıklaması değildir?

A.   Gizlenmiş

B.   Giriş

C.   Çıktı

D.   Fonksiyonel

40: Kırpma şu şekildedir:

A.   Bir veritabanındaki gürültünün bir ölçüsü '#039;

B.   Farklı sunucular arasında dağıtım için bir veritabanı bölümü

C.   SSH üzerinden birden çok nesne veritabanına eşzamanlı olarak erişmek

D.   Yukarıdakilerin hiçbiri

41: Değişim ve sapma tespiti nedir?

A.   Daha önce ölçülen veya normatif değerlerden verilerdeki en önemli değişiklikleri keşfetmeye odaklanan bir görev

B.   Bir veri alt kümesi için kompakt bir açıklama bulmak için yöntemler.

C.   Değişkenler arasındaki önemli bağımlılıkları tanımlayan bir model bulma süreci

D.   Verilerden, veritabanındaki tüm değişkenlerin/alanların eklem çok değişkenli olasılık yoğunluk fonksiyonunu tahmin etmek için tekniklerden oluşan bir görev.

42: Amazon.com öneri sistemini yönlendiren veri madenciliği türü nedir?

A.   Bulanık mantık

B.   Dernek Öğrenme

C.   Anomali tespiti

D.   Kümeleme algoritmaları

43: Aşağıdaki algoritmalardan hangisi genellikle denetimsiz öğrenme görevleri için uygundur?

A.   Kısıtlı Boltzmann Makinesi

B.   Bilgi-Fuzzy Networks

C.   K-güzel komşu

D.   K-ortalama algoritması

44: Aşağıdaki depolama çözümlerinden hangisi, üyeleri aynı özelliklere sahip olmayan yarı yapılandırılmış bir veri kümesi için en uygundur?

A.   MongoDB

B.   Sqlite

C.   MySQL

D.   Mariadb

45: Tüm bir popülasyonda sınıflandırma performansını tahmin etmek için _______

A.   (Bunlardan hiçbiri)

B.   Ayrık eğitim

C.   Veri kümelerini test edin

D.   Ayrık Eğitim ve Test Veri Kümeleri

46: Genelleme hatası bir sonucudur

A.   Overfit

B.   Parametrik analiz

C.   Yetersiz uydurmak

D.   Kötü tanımlanmış Chernoff bağlı

47: Bunlardan hangisi evrimsel hesaplama yöntemleridir?

A.   Sezgisel algoritmalar

B.   Bayesian çıkarım algoritmaları

C.   Genetik algoritmalar

D.   Kümeleme algoritmaları

48: Destek vektör makinelerinin sinir ağlarına göre bir avantajı vardır, çünkü SVM '

A.   Yukarıdakilerin hiçbiri

B.   Çevrimiçi öğrenme yoluyla antrenman yapmak daha kolay

C.   Yerel minima yakınsamasına daha dayanıklı

D.   parametrik

49: Aşağıdakilerden hangisi ortak bir kaynak sistemi değildir?

A.   Düğüm

B.   SAP kaynağı

C.   UDC

D.   DB Connect

50: Geçmiş bir veri kümesinde kendisine en çok benzer k kayıtlarının sınıflarının bir kombinasyonuna dayanan her bir kaydı bir veri kümesindeki sınıflandıran bir teknik şöyledir:

A.   En yakın komşu

B.   Lojistik regresyon

C.   Dernek Model Sorgusu

D.   Karar ağacı

51: İstatistiksel öneme dayalı verilerden faydalı IF-then kurallarının çıkarılması nedir?

A.   Ön Yöntem Eşleme

B.   Kural İndüksiyonu

C.   Bulanık mantık uygulaması

D.   Dinamik bilgi çıkarımı

52: Sınıflandırma nedir?

A.   Bir veri alt kümesi için kompakt bir açıklama bulmak için yöntemler.

B.   Bir veri öğesini önceden tanımlanmış birkaç gruptan biriyle eşleyen bir işlev öğrenmek.

C.   Bir dereceye kadar kesinliğe sahip yeni veriler üzerinde doğru olan ve diğer verilere genelleştirilen keşfedilen bir model.

D.   Verileri tanımlamak için sonlu bir kategoriyi tanımlamaya çalıştığı tanımlayıcı bir görev.

53: Aşağıdakilerden hangisi veri ambarı bir fonksiyonu değildir?

A.   Kirli verileri temizleme

B.   Verileri Çıkarma

C.   Temizlik Verileri

D.   Satın alınan verileri saklamak

54: Doğru ya da yanlış? Mars algoritması kurallar üretemez.

A.   Doğru

B.   YANLIŞ

55: Aşağıdakilerden hangisi, birbirleriyle arkadaş olmayan sosyal bir grafikte iki kişiyi bağlayan en kısa arkadaş zincirini bulmak için en uygundur?

A.   K-ortalama algoritması

B.   Markov Zincirleri

C.   Dijkstra'nın algoritması

D.   Nöral ağlar

56: Aşağıdakilerden hangisi KDD sürecinin ortak bir hedefi değildir:

A.   Tanım

B.   Verim

C.   Tahmin

57: Genetik algoritma nedir?

A.   Yapay mutasyon, crossover ve seçim gibi işlemleri gerçekleştirerek ilk rastgele ikili dizeler popülasyonunu işleyerek optimal ikili dizeyi bulmamızı sağlayan bir arama algoritması.

B.   Belirli bir modelin (bir model ve parametrelerinin) KDD sürecinin kriterlerini ne kadar iyi karşıladığını tahmin eden bir algoritma. Öngörücü doğruluğun (geçerlilik) değerlendirilmesi çapraz doğrulamaya dayanır. Tanımlayıcı kalitenin değerlendirilmesi öngörücü içerir.

C.   İşlemsel veritabanları üzerinde sık sık öğe kümesi madenciliği ve ilişkilendirme kuralı öğrenimi için klasik bir algoritma. Veritabanındaki sık ayrı ayrı öğeleri tanımlayarak ve bunları bu öğe s olduğu sürece daha büyük ve daha büyük öğe kümelerine genişleterek devam eder.

58: İlginçtir nedir?

A.   Geçerlilik, yenilik, yararlılık ve sadeliği birleştiren, desen değerinin genel bir ölçüsü.

B.   Bir dilde l ifadesi l F fe alt kümesindeki gerçekleri tanımlayan bir ifade.

C.   Modifikasyondan sonra veri hazırlama, örüntü arama, bilgi değerlendirmesi ve yineleme ile iyileştirmeyi içeren çok aşamalı bir süreç.

D.   Bir dereceye kadar kesinliğe sahip yeni veriler üzerinde doğru olan ve diğer verilere genelleştirilen keşfedilen bir model.

59: MapReduce modelinde, işlevleri harita ve azaltma doğrudan hangi tür veri yapısı üzerinde hareket eder?

A.   Mysql matrisleri

B.   Bağlantılı Listeler

C.   ilişkisel veritabanları

D.   Anahtar Değer Çifti

60: Doğal dil işlemede sözcüksel bir analizörün rolü nedir?

A.   Bir jetonun geçerliliğini kontrol eder

B.   Giriş karakterlerinin akışını jetonlara böler

C.   Bağlamsız bir dilbilgisi üretir

D.   Ayrıştırma ağacını semantik anlam için işler

61: Kümelenme nedir?

A.   Verilerden, veritabanındaki tüm değişkenlerin/alanların eklem çok değişkenli olasılık yoğunluk fonksiyonunu tahmin etmek için tekniklerden oluşan bir görev.

B.   Verileri tanımlamak için sonlu bir kategoriyi tanımlamaya çalıştığı tanımlayıcı bir görev.

C.   Bir veri öğesini önceden tanımlanmış birkaç grup veya kümeden biriyle eşleştiren bir işlev öğrenmek.

D.   Değişkenler arasındaki önemli bağımlılıkları tanımlayan bir model bulma süreci

62: Bir DBMS, veri artıklığını ve tutarsızlığını azaltır

A.   Bir veri sözlüğünü kullanmak

B.   Programı ve verileri açma

C.   İzole edilmiş dosyaları tekrarlanan verilerle en aza indirmek

D.   Referans bütünlüğünü zorlamak

63: Tipik olarak hangi tür bir Kohonen özellik haritası kullanılır?

A.   Tanımlayıcı modelleme analizi

B.   Küme analizi

C.   Keşif Veri Analizi

D.   Öngörücü analiz

64: Followng kümeleme algoritmalarından hangisi bir ojbektif işlevi optimize edebilir?

65: Tarihsel kalıplar ve gelecekteki eğilimler hakkında bilgi sağlamak için dönüştürülmüş bilgiler şu şekilde bilinir:

A.   Doğrusal regresyon

B.   Kümeleme

C.   Bilgi

D.   Meta veriler

66: Aşağıdaki özelliklerden hangisi tek katmanlı algılamalar için geçerlidir?

A.   geri çekilme

B.   ağırlıkların rastgele intikam

C.   sürekli çıktı

D.   Doğrusal olmayan ayrımları öğrenebilir

67: Aşağıdakilerden hangisi, birden fazla modeli bir topluluk modelinde birleştirmenin bir yöntemi değildir?

A.   Oylama

B.   İstifleme

C.   Ortalama

D.   Bootstrapping

68: Özetleme nedir?

A.   Daha önce ölçülen veya normatif değerlerden verilerdeki en önemli değişiklikleri keşfetmeye odaklanan bir görev

B.   Verileri tanımlamak için sonlu bir kategoriyi tanımlamaya çalıştığı tanımlayıcı bir görev.

C.   Değişkenler arasındaki önemli bağımlılıkları tanımlayan bir model bulma süreci

D.   Bir veri alt kümesi için kompakt bir açıklama bulmak için yöntemler.

69: " Donanım mağazasındaki satın alımların% 2'sinde hem bir seçim hem de kürek satın alındı ​​”dedi:

A.   Doğrulama

B.   Destek

C.   Denetimli öğrenme

D.   Topoloji

70: Çok katmanlı sinir ağı çıkışındaki adım işlevine yaygın olarak kullanılan bir sürekli alternatiftir.

A.   lojistik işlev

B.   Çok katmanlı NN sürekli çıkışı hesaplayamaz

C.   hiperbolik işlev

D.   logaritmik işlev

71: Domuz nedir

A.   Hadoop'un veri ambarı olarak çalışmasını sağlayan bir programlama dili.

B.   Bunlardan hiçbiri

C.   Hadoop ile çalışmanın ortak görevlerini basitleştiren bir programlama dili.

72: Birden fazla rastgele veri örneği almak ve her biri için bir sınıflandırma modeli oluşturmak şu şekilde bilinir:

A.   Bulanık örnekleme

B.   Binning

C.   Artırma

D.   Kümeleme

73: Hangi xPath seçici ifadesi, formun tüm bağlantı öğelerini yakalar ' http: //example.com/profile/12345' HTML sayfasında, formun tüm bağlantıları hariç tutulurken ' http: //example.com/casenumber/12345?

A.   // a/[içerir (@href, " profil ")]

B.   // a/[içerir (@href, " profil ")]/@href

C.   // href/profil

D.   //bir profil

74: Aşağıdaki algoritmalardan hangisi karar ağaçları üretir?

A.   Dbscan

B.   İd3

C.   Yukarıdakilerin hiçbiri

D.   lojistik regresyon

75: Aşağıdaki özelliklerden hangisi dinlendirici bir uygulamada bir kısıtlamadır?

A.   Vatansız

B.   doğrusal olarak ayrılabilir

C.   JSON çıktısını döndürür

D.   kasıtlı

76: Meta verilerin depolanmasından sorumlu Hadoop Dağıtılmış dosya sisteminin bileşenine

A.   DataDode

B.   FS Kabuğu

C.   Dfsadmin

D.   Namenode

77: Birden fazla değer aynı sayıda meydana gelirse, veriler:

A.   Çok yönlü

B.   Çok yapraklı

C.   Çok değişkenli

D.   Çok modlu

78: İş anlayışı aşamasının ilk adımı nedir?

A.   İş hedeflerini ve ihtiyaçlarını kesin olarak kavrayın

B.   Kaynakları, varsayımları, kısıtlamaları vb.

C.   İş hedeflerine ulaşmak için veri madenciliği hedefleri oluşturun

D.   Göreve uygulanacak tüm ilgili algoritmaların bir listesini oluşturun

79: Curl nedir?

A.   Dosyaları almak için bir komut satırı aracı

B.   Verilerin gizli özelliklerini sınıflandırmak için bir metodoloji

C.   HTTP'nin erişim iznini belirten kısmı

D.   Kombinatoryal denetimsiz özyinelemeli öğrenme algoritması

80: Bazı sayısal ölçek kullanarak bağımlılıkların güçlü yönlerini belirten model seviyesi.

A.   Sayısal seviye

B.   Birincil seviye

C.   Bağımlılık seviyesi

D.   Nicel seviye

81: Apriori, aşağıdakileri kullanarak sık sık öğe setlerini bulmak için bir seminal algoritmadır.

A.   Normal Karışım Modelleri

B.   Aday nesil

C.   Aşırı sığdırma yöntemleri

D.   Bunlardan hiçbiri

82: Birçok önemli Web API'si tarafından kullanılan kimlik doğrulama protokolüne şu denir:

A.   HTTPS

B.   Pgp

C.   Oauth

D.   SSL

83: Bunlardan hangisi KDD sürecinde bir adım değil?

A.   Veri Entegrasyonu

B.   Veri madenciliği

C.   Veri temizleme

D.   Veri niceliği

84: Aşağıdaki uygulamalardan hangisi genellikle öğrencileri sınıflandırmak için kullanılır ' Performanslar?

A.   Küme analizi

B.   Eğer ... o zaman ... analiz

C.   Regresyon analizi

D.   Piyasa-Basket Analizi

85: Anlamlı bir ortalama değeri olan herhangi bir sayısal veri setinde, ortalamanın standart sapmalarına girecek olan minimum verilerin fraksiyonu nedir?

A.   1/n^2

B.   1/n

C.   1-1/n^2

D.   1/2n

86: Kategorik bir hedef değişkeni modellemek için aşağıdaki yöntemlerden hangisi kullanılabilir?

A.   Yukarıdakilerin hepsi

B.   Lojistik regresyon

C.   Arima

D.   Doğrusal olmayan regresyon

E.   Gerileme

87: Aşağıdakilerden hangisi bir hadoop redüktörünün birincil aşaması değildir?

A.   Düzenlemek

B.   Azaltmak

C.   Harita

D.   Karıştır

88: Bunlardan hangisi bir veri madenciliği sisteminin olası bir mimarisidir?

A.   NO-COULLING

B.   Manyetik bağlantı

C.   Geçişli bağlantı

D.   QuickStart Kuplaj

89: Doğru ya da yanlış? Yapay sinir ağları doğrusal öngörücü modellerdir.

A.   Doğru

B.   YANLIŞ

90: Bir model ile tahminleri arasındaki ölçülen farklılıklar şu şekilde bilinir:

A.   Gürültü

B.   Aykırı

C.   Menzil

D.   Uygulanamayan veriler

91: Hash tabanlı teknik, işlem azaltma, porsiyon, örnekleme ve dinamik ürün sayımının hepsi neyin örnekleridir?

A.   Bir apriori algoritmasının verimliliğini artırmak için teknikler

B.   Yöntem Tekrar tekrar taramak için veritabanını taramak ve desen eşleştirme ile büyük bir aday setini kontrol edin.

C.   Aday nesli olmadan sık sık öğe setleri üretme yöntemleri.

D.   Bir veri alt kümesi için kompakt bir açıklama bulmak için yöntemler.

92: Aşağıdakilerden hangisi bir perakende müşteri veri madenciliği stratejisinin bir parçasıdır?

A.   müşteri referansları

B.   tatil indirimi

C.   para iade garantisi

D.   Sadakat Kartları

93: Sınıflandırma ağaçlarını hesaplarken hangi karar ağacı yöntemi çok seviyeli bölünmeler yapar?

A.   ID3 (yinelemeli dikotomizer 3)

B.   C4.5 algoritması

C.   Sepet (sınıflandırma ve regresyon ağaçları)

D.   Chaid (Chi Square Otomatik Etkileşim Algılama)

94: K-Medoids kümeleme algoritmasının K-Means kümelenmesi (Lloyd ' s) algoritması üzerindeki avantajı nedir?

A.   Yinelemeli iyileştirme kullanır

B.   Aykırı değerlere daha dayanıklı

C.   Yukarıdakilerin hepsi

D.   Merkeze göre kümeleri temsil eder

95: BI sunucularının iki ana işlevi:

A.   İşleme ve yönetim

B.   Kaynak ve Sonuçlar

C.   Yönetim ve Teslimat

D.   Uygulama ve Teslimat

96: Aşağıdakilerden hangisi, veritabanına JavaScript/Ajax çağrıları aracılığıyla erişen bir web sitesinden veri toplamak için uygun bir araç değildir?

A.   Yukarıdakilerin hepsi uygun

B.   Selenyum

C.   Phantomjs

D.   wget

97: Bir veritabanındaki değerler arasındaki ilişkileri tanımlamaya yardımcı olabilecek verileri keşfetmeye açıklayıcı bir yaklaşım:

A.   Öngörücü analiz

B.   Fonksiyon etkinleştirme

C.   Bağlantı Analizi

D.   Kümeleme

98: Dernek kalıplarındaki ilginçliği nasıl ölçüyorsunuz?

A.   Varyansı ölçün

B.   Ölçmeyi Ölçme

C.   meaure doğruluğu

D.   Ölçme Asansör

99: Aşağıdakilerden hangisi geçerli değil JSON?

A.   {" Cevap " ;: " bu bir "}

B.   {" Cevap ": [" bu bir "]}

C.   {[" Cevap " ;: " bu bir "]}

D.   Hepsi geçerli

100: Bir web sitesi operatörü genellikle müşterileri hakkında veri bulabilir ' IP adresleri?

A.   HTTP istek başlıkları

B.   kurabiye

C.   Sunucu günlük dosyaları

D.   Yukarıdakilerin hepsi