أسئلة التنقيب عن البيانات باللغات العربية

أسئلة التنقيب عن البيانات باللغات العربية

ستساعدك أسئلة وإجابات التنقيب عن البيانات متعددة الخيارات على فهم موضوع التنقيب عن البيانات بشكل أفضل. استعد للاختبار أو المقابلة التالية مع هذه المجموعة المكونة من 100+ بيانات MCQ.
قم بالتمرير لأسفل لتبدأ بالإجابة.

1: ما هي الصناعة التي يمكن أن تستفيد من استخراج البيانات؟

A.   كل هذه

B.   بيع بالتجزئة

C.   تصنيع

D.   التمويل/المصرفية

2: مع أي من هذه الطبقات تبدأ الشبكة العصبية؟

A.   طبقة الإخراج

B.   طبقة خفية

C.   طبقة شفافة

D.   طبقة الإدخال

3: يمكن أن تؤدي التغييرات في أجزاء من الكود إلى مشكلة بيانات ______________.

A.   تتعارض

B.   متسخ

C.   غير متكامل

D.   حبيبي

4: في شبكة عصبية ، إلى ماذا تشير الطوبولوجيا؟

A.   نطاق المتغيرات في مجموعة

B.   عدد العقد المستخدمة

C.   التصور الرسومي للبيانات

D.   عدد الطبقات وعدد العقد في كل طبقة

5: أي من خوارزميات التجميع التالية يمكن أن تجد مجموعات من الشكل التعسفي؟

A.   رابط واحد

B.   DSBSCAN

C.   كلاهما

D.   أيا من هذه

6: أشجار القرار قادرة على التعامل مع القيم المفقودة دون استخدام أي تحول فرض. صحيحة أو خاطئة؟

A.   خطأ شنيع

B.   حقيقي

7: A (N) _____ تخلق خوارزمية قواعد تصف عدد المرات التي حدثت فيها الأحداث معًا.

A.   شايد

B.   صناعي

C.   تشذيب

D.   ترابطي

8: أي مما يلي صحيح XML؟

A.   & lt ؛ body Answer = " ؛ صالح " ؛ & gt ؛ هذا واحد & lt ؛/body & gt ؛

B.   & lt ؛ صالح & gt ؛ هذا واحد & lt ؛/صالح & gt ؛

C.   & lt ؛ صالح & gt ؛ " ؛ هذا واحد " ؛ & lt ؛/appal & gt ؛

D.   كلها صالحة

9: أي مما يلي ليس قاعدة بيانات علائقية؟

A.   كل ما ورداعلاه

B.   أباتشي كاساندرا

C.   جدول Google Big

D.   mongodb

10: ما هو تصور البيانات؟

A.   المصطلح الفني لفعل البيانات المخزنة في الخادم

B.   تنبؤ منظم ومتطور لنتائج البيانات

C.   التفسير المرئي للعلاقات المعقدة في البيانات متعددة الأبعاد

11: ما هي عملية KDD؟

A.   فك التشفير التفاضلي

B.   تقاس الصعود من خلال البعد عالي التأثير

C.   اكتشاف المعرفة في قواعد البيانات

D.   اكتشاف بيانات K-mean

12: أي من هذه ليست أنواع البرمجيات التحليلية:

A.   كلها أنواع صالحة

B.   الشبكة العصبية

C.   إحصائي

D.   التعلم الالي

13: صحيحة أو خاطئة؟ المؤشرات الاقتصادية هي عوامل بيانات خارجية.

A.   خطأ شنيع

B.   حقيقي

14: أي من التخصصات التالية يتداخل مع تعدين البيانات؟

A.   كل ما ورداعلاه

B.   الذكاء الاصطناعي

C.   إحصائيات

D.   اللغويات

15: في النماذج التنبؤية ، تسمى القيم أو الفئات المراد تنبؤها بـ:

A.   متكل

B.   كل هذه

C.   إجابة

D.   المتغيرات المستهدفة

16: أنت مدير مخاطر الائتمان لبنك البيع بالتجزئة. بعض المعلومات حول العملاء متاحة للتحليلات. بناءً على هذه البيانات ، عليك أن تقرر أن الشخص سيكون عميلًا جيدًا أو سيئًا. اختر مهمة تعدين البيانات المناسبة لمشاكل العمل هذه.

A.   تصنيف

B.   تراجع

C.   تجزئة

17: تُعرف عناصر البيانات المجمعة في العلاقات والتفضيلات باسم:

A.   مجموعات يمكن التنبؤ بها

B.   المنظمات الوظيفية

C.   درجات من الملاءمة

D.   عناقيد المجموعات

18: ما هي أشجار القرار؟

A.   التقارير المعقدة التي تم إنشاؤها بواسطة عالم بيانات مؤهل

B.   الأبعاد الهرمية التي يمكن إنشاؤها مع متصفح مكعب مفرط

C.   البيانات التي لم يتم جمعها من قبل المؤسسة ، مثل البيانات المتوفرة من كتاب مرجعي

D.   الهياكل التي تولد قواعد لتصنيف مجموعة البيانات

19: ما هي طرق استخراج البيانات الشائعة؟

A.   نماذج التعلم العلائقية

B.   أشجار وقواعد القرار

C.   كل هذه

D.   نماذج التبعية الرسومية الاحتمالية

20: صحيح من كاذبة؟ تعتبر بنية تعدين بيانات الاقتران الفضفاضة بشكل أساسي لأنظمة استخراج البيانات المستندة إلى الذاكرة والتي لا تتطلب قابلية التوسع العالية والأداء العالي.

A.   خطأ شنيع

B.   حقيقي

21: ما هو Drisp-DM؟

A.   تم تطوير شجرة قرار في عام 1980 ' ولكنها تم استبدالها بالكامل تقريبًا بطريقة العربة اليوم

B.   طريقة ستة مراحل للتنبؤ بعادات شراء التجارة الإلكترونية

C.   خوارزمية الانحدار الخطي Microsoft '

D.   عملية قياسية عبر الصناعة لاستخراج البيانات

22: تُعرف الدالة التي تستخدمها عقدة في شبكة عصبية لتحويل بيانات الإدخال من أي مجال للقيم إلى نطاق محدود من القيم باسم A (N):

A.   سالف

B.   وظيفة التنشيط

C.   الارتباك مصفوفة

D.   تشي مربع

23: صحيحة أو خاطئة؟ الاختبارات في العربة دائما ثنائية.

A.   حقيقي

B.   خطأ شنيع

24: ما هو مقياس كم يتغير متغيران عشوائيان معًا؟

A.   الانحراف المعياري الثنائي

B.   التباين

C.   polyconvergence

D.   الجمود العشوائي

25: أي من هذه مثال على علاقة نمط متسلسلة؟

A.   باستخدام تجربة العمل وغريزة الأمعاء لتصميم مخطط أرضي جديد في متجر للبقالة

B.   إعادة تنظيم فريق كرة السلة الخاص بك في مجموعة البداية بناءً على تحليل الأداء

C.   وضع اثنين من العناصر التي تم شراؤها بشكل متكرر بجوار بعضها البعض على الرف

D.   التنبؤ باحتمالية شراء حقيبة تحمل على الظهر بناءً على شراء المستهلك لأكياس النوم وأحذية المشي لمسافات طويلة

26: ترتبط الإيرادات السنوية للشركة الدولية بسمات أخرى مثل الإعلان ، وسعر الصرف ، ومعدل الصرف ، وما إلى ذلك. اختر مهمة تعدين البيانات المناسبة لهذه المشكلة التجارية.

A.   تجزئة

B.   تصنيف

C.   تراجع

27: ما هي الطبقة الأمامية لعمارة تعدين البيانات؟

A.   واجهة مستخدم سهلة الاستخدام وسهلة الاستخدام

B.   جدران الحماية المنشأة لحماية البيانات من مصادر ضارة

C.   الجهاز المصمم خصيصًا لتخزين كميات هائلة من البيانات

D.   فريق المبرمجين الذين صمموا البرنامج المستخدم في مشروع تعدين معين

28: طائرة تضخم هي أ

A.   حدود القرار فصل فئات البيانات

B.   متغير خوارزمية C4.5

C.   مجموعة من ملفات النص التشعبي المرتبط

D.   حالة الخطأ غير المنتهية

29: البيانات التي لم يتم جمعها من قبل المؤسسة ، مثل البيانات من قاعدة بيانات ملكية ، والتي يتم دمجها مع بيانات المؤسسة الخاصة معروفة باسم:

A.   تراكب

B.   الزائد

C.   ضوضاء

D.   تاريخ غير قابل للتطبيق

30: أي من هذه لا تعتبر عوامل بيانات داخلية؟

A.   سعر

B.   الانكماش الاقتصادي

C.   مهارات الموظفين

D.   وضع المنتج

31: ما هي تقنية استخراج البيانات التي تنظم مجموعات من البيانات في مجموعات محددة مسبقًا؟

A.   الزخرفة المتسلسلة

B.   تجمع

C.   تصنيف

D.   gamification

32: مستوى النموذج الذي يحدد (في كثير من الأحيان بيانيا) أي المتغيرات تعتمد محليا على بعضها البعض.

A.   المستوى الهيكلي

B.   المستوى النوعي

C.   المرحلة الابتدائية

D.   المستوى الكمي

33: لزيادة ثقة حالتك في أداء التصنيف على جميع السكان ، يجب عليك:

A.   تقليل حجم مجموعة بيانات التدريب

B.   زيادة حجم مجموعة بيانات التدريب

C.   زيادة حجم مجموعة بيانات الاختبار

D.   تقليل حجم مجموعة بيانات الاختبار

34: الخوارزمية التي تعمل على تشغيل محرك بحث Google هي:

A.   adaboost

B.   طريقة brin صفحة

C.   Googlecrawler

D.   رتبة صفحة

35: في العلاقة بين متغيرين ، ما هو الفرق بين السوابق وما يليها؟

A.   السوابق دائمًا متغير معقد للغاية

B.   لا شيء ، فهي قابلة للتبديل

C.   السوابق على اليمين ، والنتيجة على اليسار.

D.   السوابق على اليسار ، والنتيجة على اليمين

36: في تحليل بيانات السلسلة الزمنية ، تسمى القيمة المتوسطة على مدى فترة زمنية معينة (عادة ما تكون هناك فاصل زمني في الماضي حتى الوقت الحاضر) A (N)

A.   المتوسط ​​الجزئي

B.   يعني غير متحيز

C.   مركب يعني

D.   المتوسط ​​المتحرك

37: ما هو الانحدار؟

A.   تعلم وظيفة تقوم بتعيين عنصر بيانات في واحدة من عدة مجموعات محددة مسبقًا.

B.   تعبير E بلغة L تصف الحقائق في مجموعة فرعية Fe من F.

C.   مهمة وصفية حيث يسعى المرء إلى تحديد مجموعة محدودة من الفئات لوصف البيانات.

D.   تعلم وظيفة تقوم بتعيين عنصر بيانات إلى متغير تنبؤ ذي قيمة حقيقية.

38: ما هي نمذجة التبعية؟

A.   عملية متعددة الخطوات تتضمن تحضير البيانات ، والبحث في الأنماط ، وتقييم المعرفة ، والصقل مع التكرار بعد التعديل.

B.   تعلم وظيفة تقوم بتعيين عنصر بيانات في واحدة من عدة مجموعات أو مجموعات محددة مسبقًا.

C.   عملية العثور على نموذج يصف تبعيات كبيرة بين المتغيرات

D.   المهمة التي تتكون من تقنيات لتقدير ، من البيانات ، وظيفة كثافة الاحتمال متعددة المتغيرات المشتركة لجميع المتغيرات/الحقول في قاعدة البيانات.

39: أي من هذه ليست وصفًا شائعًا للطبقات؟

A.   مختفي

B.   مدخل

C.   انتاج |

D.   وظيفي

40: يشير Sharding إلى:

A.   مقياس للضوضاء في محتويات قاعدة البيانات

B.   تقليص قاعدة بيانات للتوزيع عبر خوادم مختلفة

C.   في وقت واحد الوصول إلى قواعد بيانات كائنات متعددة عبر SSH

D.   لا شيء مما بالأعلى

41: ما هو الكشف عن التغيير والانحراف؟

A.   مهمة تركز على اكتشاف أهم التغييرات في البيانات من القيم المقاسة أو المعيارية مسبقًا

B.   طرق لإيجاد وصف مضغوط لمجموعة فرعية من البيانات.

C.   عملية العثور على نموذج يصف تبعيات كبيرة بين المتغيرات

D.   المهمة التي تتكون من تقنيات لتقدير ، من البيانات ، وظيفة كثافة الاحتمال متعددة المتغيرات المشتركة لجميع المتغيرات/الحقول في قاعدة البيانات.

42: ما هو نوع تعدين البيانات الذي يدفع نظام توصية Amazon.com؟

A.   المنطق الضبابي

B.   تعلم جمعية

C.   إكتشاف عيب خلقي

D.   خوارزميات التجميع

43: أي من الخوارزميات التالية مناسبة بشكل عام لمهام التعلم غير الخاضعة للإشراف؟

A.   المقيد آلة بولتزمان

B.   شبكات المعلومات

C.   جار K-nearest

D.   خوارزمية K-Means

44: أي من حلول التخزين التالية هي الأنسب لمجموعة البيانات شبه منظمة التي ليس أعضاؤها جميعها لديهم نفس السمات؟

A.   mongodb

B.   sqlite

C.   MySQL

D.   مارياد

45: من أجل تقدير أداء التصنيف على عدد السكان بأكمله ، تحتاج إلى _______

A.   (أيا من هذه)

B.   تفكيك التدريب

C.   اختبار مجموعات البيانات

D.   تفكيك التدريب واختبار مجموعات البيانات

46: خطأ التعميم هو نتيجة

A.   تجاوز

B.   تحليل حدودي

C.   المنفعة

D.   شيرنوف محددة بشكل سيئ

47: أي من هذه الطرق الحسابية التطورية؟

A.   خوارزميات الاستدلال

B.   خوارزميات الاستدلال بايزي

C.   الخوارزميات الجينية

D.   خوارزميات التجميع

48: تتمتع آلات المتجهات الدعم بميزة على الشبكات العصبية لأن SVM ' ؛

A.   لا شيء مما بالأعلى

B.   أسهل في التدريب عبر التعلم عبر الإنترنت

C.   أكثر مقاومة للتقارب المحلي المحلي

D.   حدودي

49: أي مما يلي ليس نظام مصدر شائع؟

A.   العقدة

B.   مصدر SAP

C.   UDC

D.   DB Connect

50: تقنية تصنف كل سجل في مجموعة بيانات تستند إلى مجموعة من فئات السجلات (السجلات) الأكثر تشابهًا لها في مجموعة بيانات تاريخية هي:

A.   اقرب جار

B.   الانحدار اللوجستي

C.   استعلام نموذج الجمعية

D.   شجرة القرار

51: ما هو استخراج القواعد المفيدة إذا كانت من البيانات بناءً على الأهمية الإحصائية؟

A.   طريقة أولية رسم الخرائط

B.   تحريض القاعدة

C.   تطبيق المنطق الغامض

D.   استنتاج المعلومات الديناميكية

52: ما هو التصنيف؟

A.   طرق لإيجاد وصف مضغوط لمجموعة فرعية من البيانات.

B.   تعلم وظيفة تقوم بتعيين عنصر بيانات في واحدة من عدة مجموعات محددة مسبقًا.

C.   نمط اكتشف صحيح على بيانات جديدة مع درجة ما من اليقين ، ويعتمد على البيانات الأخرى.

D.   مهمة وصفية حيث يسعى المرء إلى تحديد مجموعة محدودة من الفئات لوصف البيانات.

53: أي مما يلي ليس وظيفة مستودعات البيانات؟

A.   تنظيف البيانات القذرة

B.   استخراج البيانات

C.   تنظيف البيانات

D.   تخزين البيانات المشتراة

54: صحيحة أو خاطئة؟ لا يمكن لخوارزمية المريخ أن تنتج قواعد.

A.   حقيقي

B.   خطأ شنيع

55: أي مما يلي هو الأنسب للعثور على أقصر سلسلة من الأصدقاء يربطان شخصين في رسم بياني اجتماعي ليسوا أصدقاء لبعضهم البعض؟

A.   خوارزمية K-Means

B.   سلاسل ماركوف

C.   Dijkstra ' ؛ S خوارزمية

D.   الشبكات العصبية

56: أي مما يلي ليس هدفًا مشتركًا لعملية KDD:

A.   وصف

B.   أداء

C.   تنبؤ

57: ما هي الخوارزمية الوراثية؟

A.   خوارزمية البحث التي تمكننا من تحديد موقع السلسلة الثنائية المثلى عن طريق معالجة مجموعة عشوائية أولية من السلاسل الثنائية من خلال إجراء عمليات مثل الطفرة الاصطناعية والتقاطع والاختيار.

B.   خوارزمية تقدر مدى جودة نمط معين (نموذج ومعلماته) تلبي معايير عملية KDD. يعتمد تقييم الدقة التنبؤية (الصلاحية) على التحقق من صحة الصليب. تقييم الجودة الوصفية ينطوي على التنبؤ أ

C.   خوارزمية كلاسيكية لمجموعة العناصر المتكررة مجموعة التعدين وتعلم قاعدة التعلم عبر قواعد بيانات المعاملات. يستمر عن طريق تحديد العناصر الفردية المتكررة في قاعدة البيانات وتوسيعها إلى مجموعات العناصر الأكبر والأكبر طالما

58: ما هو الاهتمام؟

A.   مقياس شامل لقيمة النمط ، والجمع بين الصلاحية ، والجدة ، والفائدة ، والبساطة.

B.   تعبير E بلغة L تصف الحقائق في مجموعة فرعية Fe من F.

C.   عملية متعددة الخطوات تتضمن تحضير البيانات ، والبحث في الأنماط ، وتقييم المعرفة ، والصقل مع التكرار بعد التعديل.

D.   نمط اكتشف صحيح على بيانات جديدة مع درجة ما من اليقين ، ويعتمد على البيانات الأخرى.

59: في نموذج MapReduce ، تعمل وظائف MapReduce وتقليلها مباشرة على أي نوع من بنية البيانات؟

A.   مصفوفات MySQL

B.   قوائم مرتبطة

C.   قواعد البيانات العلائقية

D.   زوج القيمة الرئيسية

60: في معالجة اللغة الطبيعية ، ما هو دور المحلل المعجمي؟

A.   يتحقق من صحة الرمز المميز

B.   يقسم دفق أحرف الإدخال إلى الرموز

C.   يولد قواعد خالية من السياق

D.   يعالج شجرة التحليل للمعنى الدلالي

61: ما هو التجميع؟

A.   المهمة التي تتكون من تقنيات لتقدير ، من البيانات ، وظيفة كثافة الاحتمال متعددة المتغيرات المشتركة لجميع المتغيرات/الحقول في قاعدة البيانات.

B.   مهمة وصفية حيث يسعى المرء إلى تحديد مجموعة محدودة من الفئات لوصف البيانات.

C.   تعلم وظيفة تقوم بتعيين عنصر بيانات في واحدة من عدة مجموعات أو مجموعات محددة مسبقًا.

D.   عملية العثور على نموذج يصف تبعيات كبيرة بين المتغيرات

62: DBMS يقلل من تكرار البيانات وعدم الاتساق بواسطة

A.   استخدام قاموس البيانات

B.   برنامج فك الارتباط والبيانات

C.   تقليل الملفات المعزولة بالبيانات المتكررة

D.   فرض النزاهة المرجعية

63: في أي نوع من التحليل ، يتم استخدام خريطة ميزة Kohonen عادة؟

A.   تحليل النمذجة الوصفية

B.   التحليل العنقودي

C.   تحليل البيانات استكشافية

D.   التحليل التنبئي

64: أي من خوارزميات تجميع Followng يمكن أن يحسن وظيفة OJBective؟

65: تُعرف المعلومات المحولة لتوفير رؤى حول الأنماط التاريخية والاتجاهات المستقبلية باسم:

A.   الانحدارالخطي

B.   تجمع

C.   معرفة

D.   البيانات الوصفية

66: أي من الخصائص التالية تنطبق على إدراكي الطبقة الواحدة؟

A.   backpropagation

B.   عزل عشوائي للأوزان

C.   الإخراج المستمر

D.   قادر على تعلم الانفصال غير الخطية

67: أي مما يلي ليس وسيلة للجمع بين نماذج متعددة في نموذج الفرقة؟

A.   التصويت

B.   تكديس

C.   متوسط

D.   bootstrapping

68: ما هو تلخيص؟

A.   مهمة تركز على اكتشاف أهم التغييرات في البيانات من القيم المقاسة أو المعيارية مسبقًا

B.   مهمة وصفية حيث يسعى المرء إلى تحديد مجموعة محدودة من الفئات لوصف البيانات.

C.   عملية العثور على نموذج يصف تبعيات كبيرة بين المتغيرات

D.   طرق لإيجاد وصف مضغوط لمجموعة فرعية من البيانات.

69: " ؛ في 2 ٪ من عمليات الشراء في متجر الأجهزة ، تم شراء كل من اختيار ومجرفة ، "مثال على:

A.   تصديق

B.   يدعم

C.   التعلم تحت إشراف

D.   البنية

70: بديل مستمر شائع الاستخدام لوظيفة الخطوة في إخراج الشبكة العصبية متعددة الطبقات هو

A.   الوظيفة اللوجستية

B.   لا يمكن NN متعدد الطبقات حساب الإخراج المستمر

C.   وظيفة الزائدية

D.   وظيفة لوغاريتمية

71: ما هو الخنزير

A.   لغة برمجة تمكن Hadoop من العمل كمستودع بيانات.

B.   أيا من هذه

C.   لغة برمجة تبسط المهام المشتركة للعمل مع Hadoop.

72: يُعرف أخذ عينات عشوائية متعددة من البيانات وبناء نموذج تصنيف لكل منها.

A.   أخذ عينات غامضة

B.   binning

C.   تعزيز

D.   تجمع

73: الذي يلتقط تعبير محدد XPath جميع عناصر الارتباطات من النموذج ' ؛ http: //example.com/profile/12345' ؛ في صفحة HTML أثناء استبعاد جميع روابط النموذج ' ؛ http: //example.com/casenumber/12345؟

A.   // a/[يحتوي على (href ، " ؛ ملف تعريف " ؛)]

B.   // a/[يحتوي على (href ، " ؛ ملف تعريف " ؛)]/@href

C.   // href/profile

D.   //صفحه شخصيه

74: أي من الخوارزميات التالية تنتج أشجار القرار؟

A.   DBSCAN

B.   ID3

C.   لا شيء مما بالأعلى

D.   الانحدار اللوجستي

75: أي من الخصائص التالية هو قيد على تطبيق مريح؟

A.   عديمة الجنسية

B.   خطي قابل للانفصال

C.   إرجاع إخراج JSON

D.   دولة

76: يسمى مكون نظام الملفات الموزع Hadoop المسؤول عن تخزين البيانات الوصفية

A.   Datanode

B.   FS شل

C.   Dfsadmin

D.   namenode

77: إذا حدثت أكثر من قيمة واحدة في نفس عدد المرات ، فإن البيانات هي:

A.   متعدد الأوجه

B.   متعدد الأوراق

C.   متعددة

D.   متعدد الوسائط

78: ما هي الخطوة الأولى في مرحلة فهم الأعمال؟

A.   فهم بحزم أهداف العمل والاحتياجات

B.   تقييم الوضع الحالي من خلال اكتشاف الموارد والافتراضات والقيود وما إلى ذلك.

C.   إنشاء أهداف استخراج البيانات لتحقيق أهداف العمل

D.   قم بإنشاء قائمة بجميع الخوارزميات ذات الصلة المراد تطبيقها على المهمة

79: ما هو حليقة؟

A.   أداة سطر الأوامر لاسترداد الملفات

B.   منهجية لتصنيف الميزات الخفية للبيانات

C.   جزء من HTTP يحدد إذن الوصول

D.   خوارزمية التعلم العودية غير الخاضعة للإشراف

80: مستوى النموذج الذي يحدد نقاط قوة التبعيات باستخدام بعض المقياس العددي.

A.   مستوى رقمي

B.   المرحلة الابتدائية

C.   مستوى التبعية

D.   المستوى الكمي

81: Apriori عبارة عن خوارزمية رسمية لتكوين مجموعات العناصر المتكررة باستخدام:

A.   نماذج الخليط العادية

B.   جيل المرشح

C.   الأساليب المفرطة

D.   أيا من هذه

82: يسمى بروتوكول المصادقة المستخدمة من قبل العديد من واجهات برمجة التطبيقات على شبكة الإنترنت:

A.   https

B.   PGP

C.   OAUTH

D.   SSL

83: أي من هذه ليست خطوة في عملية KDD؟

A.   تكامل البيانات

B.   بيانات التعدين

C.   تنظيف البيانات

D.   قياس البيانات

84: أي من التطبيقات التالية عادة ما تستخدم لتصنيف الطلاب ' ؛ العروض؟

A.   التحليل العنقودي

B.   إذا ... ثم ... تحليل

C.   تحليل الانحدار

D.   تحليل السلة في السوق

85: في أي مجموعة بيانات رقمية ذات قيمة متوسطة ذات معنى ، ما هو الحد الأدنى للكسر من البيانات التي ستندرج ضمن الانحرافات المعيارية للمتوسط؟

A.   1/n^2

B.   1/ن

C.   1-1/n^2

D.   1/2n

86: أي من الطريقة التالية يمكن استخدامها لنمذجة متغير الهدف الفئوي؟

A.   كل ما ورداعلاه

B.   الانحدار اللوجستي

C.   أريما

D.   الانحدار غير الخطي

E.   تراجع

87: أي مما يلي ليس مرحلة أولية من مخفض Hadoop؟

A.   نوع

B.   يقلل

C.   خريطة

D.   خلط

88: أي من هذه هي بنية محتملة لنظام استخراج البيانات؟

A.   عدم تقسيم

B.   اقتران مغناطيسي

C.   اقتران متعالي

D.   QuickStart اقتران

89: صحيحة أو خاطئة؟ الشبكات العصبية الاصطناعية هي نماذج تنبؤية خطية.

A.   حقيقي

B.   خطأ شنيع

90: تُعرف الاختلافات المقاسة بين النموذج وتوقعاته باسم:

A.   ضوضاء

B.   القيم المتطرفة

C.   يتراوح

D.   بيانات غير قابلة للتطبيق

91: التقنية القائمة على التجزئة ، وتقليل المعاملات ، والتشكيل ، وأخذ العينات ، وعد العناصر الديناميكية كلها أمثلة على ماذا؟

A.   تقنيات لتحسين كفاءة خوارزمية apriori

B.   طريقة لمسح قاعدة البيانات مرارًا وتكرارًا وتحقق من مجموعة كبيرة من المرشحين عن طريق مطابقة الأنماط.

C.   طرق توليد مجموعات العناصر المتكررة دون جيل المرشح.

D.   طرق لإيجاد وصف مضغوط لمجموعة فرعية من البيانات.

92: أي مما يلي جزء من استراتيجية تعدين بيانات العميل بالتجزئة؟

A.   شهادات العملاء

B.   عطلة بيع

C.   ضمان استعادة الاموال

D.   كروت الولاء

93: ما هي طريقة شجرة القرار التي تقوم بتقسيم متعدد المستويات عند حساب أشجار التصنيف؟

A.   ID3 (التكرار التكراري 3)

B.   C4.5 خوارزمية

C.   عربة (تصنيف وأشجار الانحدار)

D.   Chaid (اكتشاف التفاعل الأوتوماتيكي Chi Square)

94: ما هي ميزة خوارزمية التجميع K-medoids على خوارزمية التجميع K-Means (Lloyd ' ؛ s)؟

A.   يستخدم الصقل التكراري

B.   أكثر مقاومة للقيم المتطرفة

C.   كل ما ورداعلاه

D.   يمثل مجموعات من المركز

95: الوظيفتان الرئيسيتان لخوادم BI هما:

A.   المعالجة والإدارة

B.   المصدر والنتائج

C.   الإدارة والتسليم

D.   التطبيق والتسليم

96: أي مما يلي ليس أداة مناسبة لحصاد البيانات من موقع ويب يصل إلى قاعدة البيانات الخاصة به من خلال مكالمات JavaScript/Ajax؟

A.   كل ما سبق مناسب

B.   السيلينيوم

C.   phantomjs

D.   wget

97: هناك نهج وصفي لاستكشاف البيانات التي يمكن أن تساعد في تحديد العلاقات بين القيم في قاعدة البيانات هي:

A.   التحليل التنبئي

B.   تنشيط الوظيفة

C.   تحليل الارتباط

D.   تجمع

98: كيف يمكنك قياس الاهتمام في أنماط الارتباط؟

A.   قياس التباين

B.   قياس الأهمية

C.   دقة التوج

D.   قياس رفع

99: أي مما يلي غير صالح JSON؟

A.   {" ؛ الجواب " ؛: " ؛ هذا واحد " ؛}

B.   {" ؛ الجواب " ؛: [" ؛ هذا واحد " ؛]}

C.   {[" ؛ الجواب " ؛: " ؛ هذا واحد " ؛]}

D.   كلها صالحة

100: أين يمكن لمشغل موقع الويب أن يجد بيانات عن عملائها بشكل عام ؛ عناوين الانترنت بروتوكول؟

A.   HTTP طلب الرؤوس

B.   بسكويت

C.   ملفات تسجيل الخادم

D.   كل ما ورداعلاه