Soal Data Mining dalam bahasa Indonesia

Soal Data Mining dalam bahasa Indonesia

Pertanyaan dan jawaban pilihan ganda penambangan data akan membantu Anda memahami topik penambangan data dengan lebih baik. Bersiaplah untuk ujian atau wawancara Anda berikutnya dengan kumpulan 100+ pernyataan MCQ ini.
Gulir ke bawah untuk memulai dengan jawabannya.

1: Industri mana yang dapat memperoleh manfaat dari penambangan data?

A.   Semua ini

B.   Pengecer

C.   Manufaktur

D.   Keuangan/Perbankan

2: Dengan lapisan mana dari jaringan saraf mulai?

A.   Lapisan keluaran

B.   Lapisan tersembunyi

C.   Lapisan transparan

D.   Lapisan Input

3: Perubahan bagian kode dapat menyebabkan masalah data ______________.

A.   yang tidak konsisten

B.   kotor

C.   tidak terintegrasi

D.   granular

4: Dalam jaring saraf, apa yang dirujuk topologi?

A.   Kisaran variabel dalam satu set

B.   Jumlah node yang digunakan

C.   Visualisasi grafis data

D.   Jumlah lapisan dan jumlah node di setiap lapisan

5: Manakah dari algoritma pengelompokan berikut yang dapat menemukan kelompok bentuk sewenang -wenang?

A.   Single-link

B.   Dsbscan

C.   Keduanya

D.   Tak ada satupun

6: Pohon keputusan dapat menangani nilai -nilai yang hilang tanpa menggunakan transformasi penurunan. Benar atau salah?

A.   PALSU

B.   BENAR

7: A (n) _____ Algoritma menciptakan aturan yang menggambarkan seberapa sering peristiwa telah terjadi bersama.

A.   CHAID

B.   palsu

C.   pemangkasan

D.   Asosiatif

8: Manakah dari berikut ini yang valid XML?

A.   & lt; Jawaban Tubuh = " Valid " & gt; yang ini & lt;/tubuh & gt;

B.   & lt; valid & gt; satu ini & lt;/valid & gt;

C.   & lt; valid & gt; " yang ini " & lt;/valid & gt;

D.   Semua valid

9: Manakah dari berikut ini yang bukan database relasional?

A.   Semua yang di atas

B.   Apache Cassandra

C.   Google Big Table

D.   Mongodb

10: Apa itu visualisasi data?

A.   Istilah teknis untuk tindakan data yang disimpan di server

B.   Prediksi hasil data yang terstruktur dan dikembangkan

C.   Interpretasi visual hubungan kompleks dalam data multidimensi

11: Apa itu proses KDD?

A.   Dekripsi diferensial

B.   Knoop-hardness diukur melalui dimensi berdampak tinggi

C.   Penemuan pengetahuan dalam database

D.   Penemuan data K-Mean

12: Manakah dari berikut ini bukan jenis perangkat lunak analitik:

A.   Semua adalah tipe yang valid

B.   Jaringan syaraf

C.   Statistik

D.   Pembelajaran mesin

13: Benar atau salah? Indikator ekonomi adalah faktor data eksternal.

A.   PALSU

B.   BENAR

14: Manakah dari disiplin berikut yang tumpang tindih dengan penambangan data?

A.   Semua yang di atas

B.   Kecerdasan buatan

C.   Statistik

D.   Ilmu bahasa

15: Dalam model prediktif, nilai atau kelas yang akan diprediksi disebut:

A.   Bergantung

B.   Semua ini

C.   Tanggapan

D.   Variabel target

16: Anda adalah manajer risiko kredit bank ritel. Beberapa informasi tentang pelanggan tersedia untuk analitik. Berdasarkan data ini, Anda harus memutuskan bahwa seseorang akan menjadi pelanggan yang baik atau buruk. Pilih tugas penambangan data yang sesuai untuk masalah bisnis ini.

A.   Klasifikasi

B.   Regresi

C.   Segmentasi

17: Item data yang dikelompokkan ke dalam hubungan dan preferensi dikenal sebagai:

A.   Set yang dapat diprediksi

B.   Organisasi hukuman

C.   Derajat kesesuaian

D.   Kluster

18: Apa itu Pohon Keputusan?

A.   Laporan kompleks yang dihasilkan oleh ilmuwan data yang memenuhi syarat

B.   Dimensi hierarkis yang dapat dibuat dengan browser hyper cube

C.   Data tidak dikumpulkan oleh organisasi, seperti data yang tersedia dari buku referensi

D.   Struktur yang menghasilkan aturan untuk klasifikasi dataset

19: Manakah metode penambangan data populer?

A.   Model Pembelajaran Relasional

B.   Pohon keputusan dan aturan

C.   Semua ini

D.   Model ketergantungan grafis probabilistik

20: Benar salah? Arsitektur penambangan data kopling longgar terutama untuk sistem penambangan data berbasis memori yang tidak memerlukan skalabilitas tinggi dan kinerja tinggi.

A.   PALSU

B.   BENAR

21: Apa itu Crisp-DM?

A.   Pohon keputusan yang dikembangkan pada tahun 1980 tetapi hampir seluruhnya digantikan oleh metode CART hari ini

B.   Metode enam fase untuk memprediksi kebiasaan pembelian e-commerce

C.   Algoritma regresi linier Microsoft

D.   Proses standar lintas industri untuk penambangan data

22: Fungsi yang digunakan oleh node dalam jaring saraf untuk mengubah data input dari domain nilai apa pun menjadi rentang nilai yang terbatas dikenal sebagai (n):

A.   Mendahului

B.   Fungsi aktivasi

C.   Matriks kebingungan

D.   Chi-square

23: Benar atau salah? Tes dalam keranjang selalu biner.

A.   BENAR

B.   PALSU

24: Berapa ukuran berapa banyak dua variabel acak yang berubah bersama?

A.   deviasi standar biner

B.   Kovarians

C.   polyconvergence

D.   Inersia stokastik

25: Manakah dari berikut ini yang merupakan contoh hubungan pola berurutan?

A.   Menggunakan pengalaman bisnis dan naluri usus untuk merancang rencana lantai baru di toko kelontong

B.   Mengatur ulang lineup awal tim bola basket Anda berdasarkan analisis kinerja

C.   Menempatkan dua barang yang sering dibeli bersebelahan di rak

D.   Memprediksi kemungkinan ransel yang dibeli berdasarkan pembelian konsumen dari kantong tidur dan sepatu hiking

26: Pendapatan tahunan perusahaan internasional berkorelasi dengan atribut lain seperti iklan, nilai tukar, tingkat inflasi dll. Memiliki nilai -nilai ini (atau estimasi yang dapat diandalkan untuk tahun berikutnya) perusahaan harus menghitung pendapatan yang diharapkan untuk tahun berikutnya. Pilih tugas penambangan data yang sesuai untuk masalah bisnis ini.

A.   Segmentasi

B.   Klasifikasi

C.   Regresi

27: Apa lapisan ujung depan arsitektur penambangan data?

A.   Antarmuka pengguna yang intuitif dan ramah pengguna

B.   Firewall didirikan untuk melindungi data dari sumber berbahaya

C.   Perangkat keras yang dirancang khusus untuk penyimpanan sejumlah besar data

D.   Tim pemrogram yang merancang perangkat lunak yang digunakan dalam proyek penambangan tertentu

28: Hyperplane adalah a

A.   Batas Keputusan Memisahkan Kelas Data

B.   Varian algoritma C4.5

C.   kumpulan file hypertext tertaut

D.   Kondisi kesalahan non-terminasi

29: Data yang tidak dikumpulkan oleh organisasi, seperti data dari database hak milik, yang dikombinasikan dengan data organisasi sendiri dikenal sebagai:

A.   Overlay

B.   Overfitting

C.   Kebisingan

D.   Tanggal yang tidak dapat ditetapkan

30: Manakah dari berikut ini yang tidak dianggap sebagai faktor data internal?

A.   Harga

B.   Penurunan Ekonomi

C.   Keterampilan staf

D.   POSISI PRODUK

31: Teknik penambangan data mana yang mengatur set data ke dalam kelompok yang telah ditentukan?

A.   Pola berurutan

B.   Kekelompokan

C.   Klasifikasi

D.   Gamifikasi

32: Tingkat model yang menentukan (sering secara grafis) variabel mana yang saling bergantung satu sama lain.

A.   Level Struktural

B.   Level kualitatif

C.   Tingkat utama

D.   Level kuantitatif

33: Untuk meningkatkan kepercayaan diri kinerja klasifikasi Anda pada seluruh populasi, Anda harus:

A.   Kurangi ukuran dataset pelatihan

B.   Tingkatkan ukuran dataset pelatihan

C.   Tingkatkan ukuran dataset uji

D.   Kurangi ukuran dataset uji

34: Algoritma yang memberi daya pada mesin pencari Google adalah:

A.   Adaboost

B.   Metode Brin-Page

C.   Googlecrawler

D.   Peringkat halaman

35: Dalam hubungan antara dua variabel, apa perbedaan antara anteseden dan akibatnya?

A.   Anteseden selalu merupakan variabel yang sangat kompleks

B.   Tidak ada, mereka dapat dipertukarkan

C.   Anteseden ada di sebelah kanan, akibatnya ada di sebelah kiri.

D.   Anteseden ada di sebelah kiri, akibatnya di sebelah kanan

36: Dalam analisis data seri-waktu, nilai rata-rata selama periode waktu tertentu (biasanya beberapa interval di masa lalu hingga saat ini) disebut a (n)

A.   rata -rata parsial

B.   tidak memihak

C.   rata -rata gabungan

D.   Moving Average

37: Apa itu regresi?

A.   Mempelajari fungsi yang memetakan item data ke dalam salah satu dari beberapa kelompok yang telah ditentukan.

B.   Ekspresi E dalam bahasa yang menggambarkan fakta dalam subset Fe dari F.

C.   Tugas deskriptif di mana seseorang berupaya mengidentifikasi serangkaian kategori yang terbatas untuk menggambarkan data.

D.   Mempelajari fungsi yang memetakan item data ke variabel prediksi bernilai nyata.

38: Apa itu pemodelan ketergantungan?

A.   Proses multi-langkah yang melibatkan persiapan data, pencarian pola, evaluasi pengetahuan, dan penyempurnaan dengan iterasi setelah modifikasi.

B.   Mempelajari fungsi yang memetakan item data ke dalam salah satu dari beberapa kelompok atau kelompok yang telah ditentukan.

C.   Proses menemukan model yang menggambarkan ketergantungan yang signifikan antara variabel

D.   Tugas yang terdiri dari teknik untuk memperkirakan, dari data, fungsi kepadatan probabilitas multi-variat bersama dari semua variabel/bidang dalam database.

39: Manakah dari berikut ini yang bukan deskripsi umum dari lapisan?

A.   Tersembunyi

B.   Memasukkan

C.   Keluaran

D.   Fungsional

40: Sharding mengacu pada:

A.   Ukuran kebisingan dalam konten database

B.   membagi database untuk distribusi di berbagai server

C.   secara bersamaan mengakses beberapa database objek melalui SSH

D.   bukan dari salah satu di atas

41: Apa itu deteksi perubahan dan penyimpangan?

A.   Tugas yang berfokus pada menemukan perubahan paling signifikan dalam data dari nilai yang diukur atau normatif sebelumnya

B.   Metode untuk menemukan deskripsi yang ringkas untuk subset data.

C.   Proses menemukan model yang menggambarkan ketergantungan yang signifikan antara variabel

D.   Tugas yang terdiri dari teknik untuk memperkirakan, dari data, fungsi kepadatan probabilitas multi-variat bersama dari semua variabel/bidang dalam database.

42: Apa jenis penambangan data yang mendorong sistem rekomendasi Amazon.com?

A.   Logika fuzzy

B.   Pembelajaran Asosiasi

C.   Deteksi anomali

D.   Algoritma pengelompokan

43: Manakah dari algoritma berikut yang umumnya cocok untuk tugas belajar tanpa pengawasan?

A.   Mesin Boltzmann Terbatas

B.   Jaringan info-fuzzy

C.   tetangga K-nearest

D.   Algoritma K-Means

44: Manakah dari solusi penyimpanan berikut yang paling tepat untuk dataset semi-terstruktur yang anggotanya tidak semua memiliki atribut yang sama?

A.   MongoDB

B.   Sqlite

C.   Mysql

D.   Mariadb

45: Untuk memperkirakan kinerja klasifikasi pada seluruh populasi, Anda membutuhkan _______

A.   (Tak ada satupun)

B.   Pelatihan Disjoint

C.   Uji kumpulan data

D.   Disjoint Training and Test Dataset

46: Kesalahan generalisasi adalah konsekuensi dari

A.   Overfit

B.   Analisis Parametrik

C.   Underfit

D.   Chernoff Bound yang tidak jelas

47: Manakah dari berikut ini metode komputasi evolusioner?

A.   Algoritma heuristik

B.   Algoritma Inferensi Bayesian

C.   Algoritma Genetika

D.   Algoritma pengelompokan

48: Dukungan mesin vektor memiliki keunggulan dibandingkan jaringan saraf karena SVM adalah

A.   bukan dari salah satu di atas

B.   lebih mudah dilatih melalui pembelajaran online

C.   lebih tahan terhadap konvergensi minimum lokal

D.   parametrik

49: Manakah dari berikut ini yang bukan sistem sumber umum?

A.   Node

B.   Sumber SAP

C.   UDC

D.   DB Connect

50: Teknik yang mengklasifikasikan setiap catatan dalam dataset berdasarkan kombinasi kelas catatan k yang paling mirip dengan itu dalam dataset historis adalah:

A.   Tetangga terdekat

B.   Regresi logistik

C.   Kueri Model Asosiasi

D.   Pohon Keputusan

51: Apa ekstraksi aturan If-Then yang berguna dari data berdasarkan signifikansi statistik?

A.   Pemetaan metode awal

B.   Induksi aturan

C.   Aplikasi Logika Fuzzy

D.   Inferensi Informasi Dinamis

52: Apa itu klasifikasi?

A.   Metode untuk menemukan deskripsi yang ringkas untuk subset data.

B.   Mempelajari fungsi yang memetakan item data ke dalam salah satu dari beberapa kelompok yang telah ditentukan.

C.   Pola yang ditemukan yang benar pada data baru dengan beberapa tingkat kepastian, dan menggeneralisasi ke data lain.

D.   Tugas deskriptif di mana seseorang berupaya mengidentifikasi serangkaian kategori yang terbatas untuk menggambarkan data.

53: Manakah dari berikut ini yang bukan fungsi gudang data?

A.   Membersihkan Data Kotor

B.   Mengekstraksi data

C.   Data pembersih

D.   Menyimpan data yang dibeli

54: Benar atau salah? Algoritma Mars tidak dapat menghasilkan aturan.

A.   BENAR

B.   PALSU

55: Manakah dari berikut ini yang paling tepat untuk menemukan rantai teman terpendek yang menghubungkan dua orang dalam grafik sosial yang tidak berteman satu sama lain?

A.   Algoritma K-Means

B.   Rantai Markov

C.   Algoritma Dijkstra*

D.   Jaringan saraf

56: Manakah dari berikut ini yang bukan tujuan umum dari proses KDD:

A.   Keterangan

B.   Pertunjukan

C.   Ramalan

57: Apa itu algoritma genetika?

A.   Algoritma pencarian yang memungkinkan kami menemukan string biner yang optimal dengan memproses populasi acak awal string biner dengan melakukan operasi seperti mutasi buatan, crossover dan seleksi.

B.   Algoritma yang memperkirakan seberapa baik pola tertentu (model dan parameternya) memenuhi kriteria proses KDD. Evaluasi akurasi prediktif (validitas) didasarkan pada validasi silang. Evaluasi kualitas deskriptif melibatkan prediktif a

C.   Algoritma klasik untuk penambangan yang sering ditetapkan item dan pembelajaran aturan asosiasi melalui database transaksional. Itu dihasilkan dengan mengidentifikasi item individual yang sering dalam database dan memperluasnya ke set item yang lebih besar dan lebih besar selama item tersebut

58: Apa itu Ketertarikan?

A.   Ukuran keseluruhan nilai pola, menggabungkan validitas, kebaruan, kegunaan, dan kesederhanaan.

B.   Ekspresi E dalam bahasa yang menggambarkan fakta dalam subset Fe dari F.

C.   Proses multi-langkah yang melibatkan persiapan data, pencarian pola, evaluasi pengetahuan, dan penyempurnaan dengan iterasi setelah modifikasi.

D.   Pola yang ditemukan yang benar pada data baru dengan beberapa tingkat kepastian, dan menggeneralisasi ke data lain.

59: Dalam model MapReduce, memetakan dan mengurangi fungsi bertindak langsung pada jenis struktur data apa?

A.   Matriks mysql

B.   Daftar Tertaut

C.   Database Relasional

D.   Pasangan Nilai Kunci

60: Dalam pemrosesan bahasa alami, apa peran penganalisa leksikal?

A.   memeriksa validitas token

B.   membagi aliran karakter input menjadi token

C.   menghasilkan tata bahasa bebas konteks

D.   memproses pohon parse untuk makna semantik

61: Apa itu pengelompokan?

A.   Tugas yang terdiri dari teknik untuk memperkirakan, dari data, fungsi kepadatan probabilitas multi-variat bersama dari semua variabel/bidang dalam database.

B.   Tugas deskriptif di mana seseorang berupaya mengidentifikasi serangkaian kategori yang terbatas untuk menggambarkan data.

C.   Mempelajari fungsi yang memetakan item data ke dalam salah satu dari beberapa kelompok atau kelompok yang telah ditentukan.

D.   Proses menemukan model yang menggambarkan ketergantungan yang signifikan antara variabel

62: DBMS mengurangi redundansi dan ketidakkonsistenan data

A.   Memanfaatkan Kamus Data

B.   Program dan data yang tidak berpasangan

C.   Meminimalkan file terisolasi dengan data berulang

D.   Menegakkan integritas referensial

63: Dalam jenis analisis apa yang biasanya digunakan peta fitur Kohonen?

A.   Analisis Pemodelan Deskriptif

B.   Analisis Cluster

C.   Analisis Data Eksplorasi

D.   Analisis prediktif

64: Manakah dari algoritma pengelompokan followng yang dapat mengoptimalkan fungsi ojbektif?

65: Informasi yang dikonversi untuk memberikan wawasan tentang pola historis dan tren masa depan dikenal sebagai:

A.   Regresi linier

B.   Kekelompokan

C.   Pengetahuan

D.   Meta-data

66: Manakah dari properti berikut yang berlaku untuk pelapon tunggal?

A.   Backpropagation

B.   inetitalisasi bobot acak

C.   output berkelanjutan

D.   mampu mempelajari pemisahan non-linear

67: Manakah dari berikut ini yang bukan metode menggabungkan beberapa model menjadi model ensemble?

A.   Pemungutan suara

B.   Menumpuk

C.   Rata -rata

D.   Bootstrap

68: Apa itu peringkasan?

A.   Tugas yang berfokus pada menemukan perubahan paling signifikan dalam data dari nilai yang diukur atau normatif sebelumnya

B.   Tugas deskriptif di mana seseorang berupaya mengidentifikasi serangkaian kategori yang terbatas untuk menggambarkan data.

C.   Proses menemukan model yang menggambarkan ketergantungan yang signifikan antara variabel

D.   Metode untuk menemukan deskripsi yang ringkas untuk subset data.

69: " dalam 2% dari pembelian di toko perangkat keras, baik pick maupun sekop dibeli, ”adalah contoh dari:

A.   Validasi

B.   Mendukung

C.   Pembelajaran yang diawasi

D.   Topologi

70: Alternatif kontinu yang umum digunakan untuk fungsi langkah dalam output jaringan saraf berlapis-lapis adalah

A.   Fungsi Logistik

B.   NN berlapis-lapis tidak dapat menghitung output kontinu

C.   fungsi hiperbolik

D.   fungsi logaritmik

71: Apa itu babi

A.   Bahasa pemrograman yang memungkinkan Hadoop beroperasi sebagai gudang data.

B.   Tak ada satupun

C.   Bahasa pemrograman yang menyederhanakan tugas -tugas umum bekerja dengan Hadoop.

72: Mengambil beberapa sampel data acak dan membangun model klasifikasi untuk masing -masing dikenal sebagai:

A.   Pengambilan sampel fuzzy

B.   Binning

C.   Meningkatkan

D.   Kekelompokan

73: Ekspresi pemilih XPath mana yang menangkap semua elemen tautan dari formulir ' http: //example.com/profile/12345' Di halaman HTML saat mengecualikan semua tautan dari formulir ' http: //example.com/casenumber/12345?

A.   // a/[berisi (@href, " profil ")]

B.   // a/[berisi (@href, " profil ")]/@href

C.   // href/profil

D.   // a/profil

74: Manakah dari algoritma berikut yang menghasilkan pohon keputusan?

A.   Dbscan

B.   ID3

C.   bukan dari salah satu di atas

D.   regresi logistik

75: Manakah dari properti berikut yang merupakan kendala pada aplikasi yang tenang?

A.   tanpa kewarganegaraan

B.   terpisah secara linear

C.   Mengembalikan output JSON

D.   stateful

76: Komponen sistem file terdistribusi Hadoop yang bertanggung jawab untuk menyimpan metadata disebut

A.   DATANODE

B.   Fs shell

C.   Dfsadmin

D.   Namenode

77: Jika lebih dari satu nilai terjadi jumlah yang sama, data adalah:

A.   Multi-faceted

B.   Multi-leaf

C.   Multivariasi

D.   Multi-modal

78: Apa langkah pertama dalam fase pemahaman bisnis?

A.   Pegang Tujuan dan Kebutuhan Bisnis dengan kuat

B.   Nilai situasi saat ini dengan mencari tahu sumber daya, asumsi, kendala dll.

C.   Buat tujuan penambangan data untuk mencapai tujuan bisnis

D.   Buat daftar semua algoritma yang relevan untuk diterapkan pada tugas

79: Apa itu Curl?

A.   Alat baris perintah untuk mengambil file

B.   Metodologi untuk mengklasifikasikan fitur tersembunyi data

C.   Bagian dari HTTP yang menentukan izin akses

D.   Kombinatorial Algoritma Pembelajaran Rekursif Tanpa Pengawasan

80: Tingkat model yang menentukan kekuatan dependensi menggunakan beberapa skala numerik.

A.   Level numerik

B.   Tingkat utama

C.   Tingkat ketergantungan

D.   Level kuantitatif

81: Apriori adalah algoritma seminal untuk menemukan set item yang sering menggunakan:

A.   Model campuran normal

B.   Generasi Kandidat

C.   Metode overfitting

D.   Tak ada satupun

82: Protokol otentikasi yang digunakan oleh banyak API web yang signifikan disebut:

A.   Https

B.   PGP

C.   Oauth

D.   SSL

83: Manakah dari berikut ini yang bukan langkah dalam proses KDD?

A.   Integrasi data

B.   Penambangan data

C.   Pembersihan data

D.   Kuantifikasi Data

84: Manakah dari aplikasi berikut yang biasanya digunakan untuk mengklasifikasikan siswa ' Pertunjukan?

A.   Analisis cluster

B.   Jika ... lalu ... analisis

C.   Analisis regresi

D.   Analisis Basket Pasar

85: Dalam set data numerik apa pun dengan nilai rata -rata yang bermakna, berapa fraksi minimum data yang akan termasuk dalam n standar deviasi rata -rata?

A.   1/n^2

B.   1/n

C.   1-1/n^2

D.   1/2n

86: Manakah dari metode berikut yang dapat digunakan untuk memodelkan variabel target kategori?

A.   Semua yang di atas

B.   Regresi logistik

C.   Arima

D.   Regresi non-linear

E.   Regresi

87: Manakah dari berikut ini yang bukan fase utama dari peredam hadoop?

A.   Menyortir

B.   Mengurangi

C.   Peta

D.   Shuffle

88: Manakah dari berikut ini yang merupakan arsitektur yang mungkin dari sistem penambangan data?

A.   No-coupling

B.   Kopling magnetik

C.   Kopling transitif

D.   Kopling QuickStart

89: Benar atau salah? Jaringan saraf buatan adalah model prediktif linier.

A.   BENAR

B.   PALSU

90: Perbedaan yang diukur antara model dan prediksinya dikenal sebagai:

A.   Kebisingan

B.   Outlier

C.   Jangkauan

D.   Data yang tidak dapat diterapkan

91: Teknik berbasis hash, pengurangan transaksi, porsi, pengambilan sampel, dan penghitungan item dinamis adalah semua contoh apa?

A.   Teknik untuk meningkatkan efisiensi algoritma apriori

B.   Metode untuk berulang kali memindai pemindaian database dan memeriksa satu set kandidat besar berdasarkan pencocokan pola.

C.   Metode menghasilkan set item yang sering tanpa pembuatan kandidat.

D.   Metode untuk menemukan deskripsi yang ringkas untuk subset data.

92: Manakah dari berikut ini yang merupakan bagian dari strategi penambangan data pelanggan ritel?

A.   Testimoni Pelanggan

B.   Penjualan Liburan

C.   Garansi uang kembali

D.   Kartu Loyalitas

93: Metode pohon keputusan mana yang melakukan pemisahan multi-level saat menghitung pohon klasifikasi?

A.   ID3 (Dikotomiser Iteratif 3)

B.   Algoritma C4.5

C.   CART (Pohon Klasifikasi dan Regresi)

D.   Deteksi Interaksi Otomatis CHAID (Chi Square)

94: Apa keuntungan dari algoritma pengelompokan K-medoids atas algoritma K-Means Clustering (Lloyd?

A.   menggunakan penyempurnaan berulang

B.   lebih tahan terhadap outlier

C.   semua yang di atas

D.   mewakili cluster di tengah

95: Dua fungsi utama server BI adalah:

A.   Pemrosesan dan Manajemen

B.   Sumber dan hasil

C.   Manajemen dan pengiriman

D.   Aplikasi dan pengiriman

96: Manakah dari berikut ini yang bukan alat yang tepat untuk memanen data dari situs web yang mengakses basis data melalui panggilan JavaScript/AJAX?

A.   Semua hal di atas sesuai

B.   Selenium

C.   Phantomjs

D.   wget

97: Pendekatan deskriptif untuk mengeksplorasi data yang dapat membantu mengidentifikasi hubungan di antara nilai -nilai dalam database adalah:

A.   Analisis prediktif

B.   Aktivasi fungsi

C.   Analisis Tautan

D.   Kekelompokan

98: Bagaimana Anda mengukur ketertarikan dalam pola asosiasi?

A.   Ukur varians

B.   Ukur relevansi

C.   akurasi padang rumput

D.   Ukur lift

99: Manakah dari berikut ini yang tidak valid JSON?

A.   {" Jawab ": " Yang Ini "}

B.   {" Jawab ": [" Yang Ini "]}

C.   {[" Jawab ": " Yang Ini "]}

D.   Semuanya valid

100: Di mana operator situs web umumnya dapat menemukan data tentang pelanggannya ' Alamat IP?

A.   Header permintaan http

B.   kue

C.   Logfiles Server

D.   semua yang di atas