صفحة 29 - كتاب علم البيانات - الصف 11 - الفصل 1 - المملكة العربية السعودية

الكتاب: كتاب علم البيانات - الصف 11 - الفصل 1 | المادة: علم البيانات | المرحلة: الصف 11 | الفصل الدراسي: 1

الدولة: المملكة العربية السعودية | المنهج: المنهج السعودي - وزارة التعليم

📚 معلومات الصفحة

الكتاب: كتاب علم البيانات - الصف 11 - الفصل 1 | المادة: علم البيانات | المرحلة: الصف 11 | الفصل الدراسي: 1

الدولة: المملكة العربية السعودية | المنهج: المنهج السعودي - وزارة التعليم

نوع المحتوى: درس تعليمي

📝 ملخص الصفحة

📚 تمرينات تقييم مفاهيم البيانات الضخمة

المفاهيم الأساسية

البيانات الضخمة: بيانات كبيرة جدًا أو معقدة لا يمكن معالجتها باستخدام الطرائق التقليدية.

الحوسبة في الذاكرة: طريقة لتسهيل تحليل البيانات الضخمة تعتمد بصورة أساسية على ذاكرة الحاسب الرئيسة (RAM) لتخزين البيانات.

اختيار البيانات: تحديد جزء من مجموعة البيانات الذي نريد استخدامه لعملية اكتشاف المعرفة.

تمثيل المعرفة: عملية استخراج البيانات من خلال تحليلات الأنماط.

خريطة المفاهيم

```markmap

البيانات الضخمة (Big Data)

تقنيات إدارة البيانات الضخمة

من التقنيات الخمس

  • السرعة
  • المصداقية
  • مستودع البيانات

اكتشاف المعرفة

  • ليست عملية بسيطة
  • تتطلب خطوات محددة

التخزين السحابي

  • ليس الطريقة الوحيدة للتخزين

مزايا التخزين السحابي للبيانات الضخمة

  • قابلية التوسع
  • تكلفة منخفضة لتحليل البيانات

مستودع البيانات

  • مستودع يتوافر سحابيًا عادةً
  • لتخزين كميات هائلة من البيانات الأولية وغير المعالجة

الحوسبة في الذاكرة

  • تعتمد على ذاكرة الوصول العشوائي (RAM)
  • لتسهيل تحليل البيانات الضخمة

بحيرة البيانات

  • قاعدة بيانات
  • تخزن البيانات الحالية والتاريخية الناتجة عن أنظمة المعاملات الأساسية في المؤسسة

خطوات اكتشاف المعرفة

اختيار البيانات

  • تحديد جزء من مجموعة البيانات للاستخدام

تمثيل المعرفة

  • عملية استخراج البيانات عبر تحليلات الأنماط
```

نقاط مهمة

  • البيانات الضخمة تتحدى الطرق التقليدية للمعالجة.
  • إدارة البيانات الضخمة تعتمد على تقنيات متعددة تشمل السرعة والمصداقية.
  • اكتشاف المعرفة عملية منهجية وليست بسيطة.
  • التخزين السحابي له مزايا مهمة لكنه ليس الحل الوحيد.
  • هناك فرق بين مفاهيم مستودع البيانات وبحيرة البيانات.

📄 النص الكامل للصفحة

تمرينات حدد الجملة الصحيحة والجملة الخاطئة فيما يلي: 1. تشير البيانات الضخمة إلى البيانات الكبيرة جدًا أو المعقدة التي لا يمكن معالجتها باستخدام الطرائق التقليدية. 2 من التقنيات الخمس التي تمكن من إدارة البيانات الضخمة السرعة والمصداقية ومستودع البيانات. 3. يُعد اكتشاف المعرفة عملية بسيطة لا تتطلب أي خطوات محددة. 4. التخزين السحابي هو طريقة التخزين الوحيدة المستخدمة لكم البيانات الكبير مثل البيانات الضخمة. 5. تعد قابلية التوسع والتكلفة المنخفضة لتحليل البيانات من المزايا العديدة لتخزين البيانات الضخمة سحابيا. 6. مستودع البيانات هو مستودع يتوافر سحابيًا عادةً لتخزين كميات هائلة من البيانات الأولية وغير المعالجة. 7. الحوسبة في الذاكرة هي طريقة لتسهيل تحليل البيانات الضخمة لاعتمادها بصورة أساسية على ذاكرة الحاسب الرئيسة ذاكرة الحاسب الرئيسة مثل ذاكرة الوصول العشوائي (RAM) لتخزين البيانات. 8. تشير بحيرة البيانات إلى قاعدة البيانات التي تخزن البيانات الحالية والتاريخية الناتجة عن أنظمة المعاملات الأساسية في المؤسسة. 9. اختيار البيانات هو تحديد جزء من مجموعة البيانات الذي نريد استخدامه لعملية اكتشاف المعرفة. 10. تمثيل المعرفة هو عملية استخراج البيانات من خلال تحليلات الأنماط. وزارة التعليم 29 Ministry of Education 2025-1447

✅ حلول أسئلة الكتاب الرسمية

عدد الأسئلة: 10

سؤال 1: تشير البيانات الضخمة إلى البيانات الكبيرة جدًا أو المعقدة التي لا يمكن معالجتها باستخدام الطرائق التقليدية.

الإجابة: س1: ✓ صح

خطوات الحل:

  1. **الشرح:** لنفهم هذا السؤال: السؤال يعرض تعريفًا لمصطلح "البيانات الضخمة". التعريف يقول إنها بيانات كبيرة جدًا أو معقدة بحيث لا يمكن معالجتها بالطرق التقليدية. هذا التعريف يتوافق مع المفهوم العلمي المعروف للبيانات الضخمة (Big Data) الذي يشير إلى مجموعات البيانات الهائلة في الحجم والتعقيد التي تتطلب تقنيات خاصة للمعالجة. إذن العبارة في السؤال **صحيحة** لأنها تعكس التعريف الدقيق.

سؤال 2: من التقنيات الخمس التي تمكن من إدارة البيانات الضخمة السرعة والمصداقية ومستودع البيانات.

الإجابة: س2: X خطأ

خطوات الحل:

  1. **الشرح:** لننظر إلى العبارة: "من التقنيات الخمس التي تمكن من إدارة البيانات الضخمة السرعة والمصداقية ومستودع البيانات". الفكرة هنا هي أن تقنيات إدارة البيانات الضخمة تشمل عادةً خمسة جوانب رئيسية تُعرف بـ "5Vs" وهي: الحجم (Volume)، السرعة (Velocity)، التنوع (Variety)، المصداقية (Veracity)، والقيمة (Value). العبارة ذكرت "السرعة والمصداقية ومستودع البيانات" - لكن "مستودع البيانات" ليس أحد الـ 5Vs الأساسية، بل هو أحد أنظمة التخزين. إذن العبارة **غير صحيحة** لأنها خلطت بين تقنيات الإدارة (5Vs) وأنظمة التخزين.

سؤال 3: يُعد اكتشاف المعرفة عملية بسيطة لا تتطلب أي خطوات محددة.

الإجابة: س3: X خطأ

خطوات الحل:

  1. **الشرح:** السؤال يقول: "يُعد اكتشاف المعرفة عملية بسيطة لا تتطلب أي خطوات محددة." لنفهم هذا: اكتشاف المعرفة (Knowledge Discovery) هو عملية منهجية تتضمن عدة مراحل محددة مثل: تنظيف البيانات، تكامل البيانات، اختيار البيانات، تحويل البيانات، تنقيب البيانات، وتقييم النماذج. هذه عملية معقدة وليست بسيطة، وتتبع خطوات منهجية واضحة. إذن العبارة **غير صحيحة** لأن اكتشاف المعرفة عملية منهجية تتطلب خطوات محددة.

سؤال 4: التخزين السحابي هو طريقة التخزين الوحيدة المستخدمة لكم البيانات الكبير مثل البيانات الضخمة.

الإجابة: س4: X خطأ

خطوات الحل:

  1. **الشرح:** العبارة تقول: "التخزين السحابي هو طريقة التخزين الوحيدة المستخدمة لكم البيانات الكبير مثل البيانات الضخمة." لنفكر في هذا: بينما التخزين السحابي شائع للبيانات الضخمة، فهو ليس الطريقة الوحيدة. توجد طرق تخزين أخرى مثل: - التخزين المحلي (On-premise storage) - أنظمة الملفات الموزعة (مثل Hadoop HDFS) - قواعد البيانات الضخمة إذن العبارة **غير صحيحة** لأن هناك طرق تخزين متعددة للبيانات الضخمة وليس السحابة فقط.

سؤال 5: تعد قابلية التوسع والتكلفة المنخفضة لتحليل البيانات من المزايا العديدة لتخزين البيانات الضخمة سحابيًا.

الإجابة: س5: ✓ صح

خطوات الحل:

  1. **الشرح:** لننظر إلى العبارة: "تعد قابلية التوسع والتكلفة المنخفضة لتحليل البيانات من المزايا العديدة لتخزين البيانات الضخمة سحابيًا." الفكرة هنا هي مميزات التخزين السحابي للبيانات الضخمة: 1. قابلية التوسع: يمكن زيادة سعة التخزين بسهولة حسب الحاجة 2. التكلفة المنخفضة: لا تحتاج لاستثمار مبدئي كبير في البنية التحتية هاتان الميزتان معترف بهما على نطاق واسع كمزايا رئيسية للتخزين السحابي. إذن العبارة **صحيحة** لأنها تصف ميزتين حقيقيتين للتخزين السحابي للبيانات الضخمة.

سؤال 6: مستودع البيانات هو مستودع يتوافر سحابيًا عادةً لتخزين كميات هائلة من البيانات الأولية وغير المعالجة.

الإجابة: س6: X خطأ

خطوات الحل:

  1. **الشرح:** السؤال يقول: "مستودع البيانات هو مستودع يتوافر سحابيًا عادةً لتخزين كميات هائلة من البيانات الأولية وغير المعالجة." لنفهم الفرق: - مستودع البيانات (Data Warehouse): يُخزن بيانات منظمة ومعالجة ومهيكلة لأغراض التحليل - بحيرة البيانات (Data Lake): تُخزن بيانات أولية وغير معالجة بأشكال مختلفة العبارة تصف بحيرة البيانات وليس مستودع البيانات، كما أن مستودعات البيانات ليست بالضرورة سحابية فقط. إذن العبارة **غير صحيحة** لأنها خلطت بين مستودع البيانات وبحيرة البيانات.

سؤال 7: الحوسبة في الذاكرة هي طريقة لتسهيل تحليل البيانات الضخمة لاعتمادها بصورة أساسية على ذاكرة الحاسب الرئيسة مثل ذاكرة الوصول العشوائي (RAM) لتخزين البيانات.

الإجابة: س7: ✓ صح

خطوات الحل:

  1. **الشرح:** لنفهم العبارة: "الحوسبة في الذاكرة هي طريقة لتسهيل تحليل البيانات الضخمة لاعتمادها بصورة أساسية على ذاكرة الحاسب الرئيسة مثل ذاكرة الوصول العشوائي (RAM) لتخزين البيانات." الفكرة هنا هي تقنية In-Memory Computing: - تعتمد على تخزين البيانات في الذاكرة الرئيسية (RAM) بدلاً من الأقراص الصلبة - هذا يسرع عمليات التحليل لأن الوصول للذاكرة أسرع بكثير - تستخدم في تحليل البيانات الضخمة لتحسين الأداء إذن العبارة **صحيحة** لأنها تصف تقنية الحوسبة في الذاكرة بدقة.

سؤال 8: تشير بحيرة البيانات إلى قاعدة البيانات التي تخزن البيانات الحالية والتاريخية الناتجة عن أنظمة المعاملات الأساسية في المؤسسة.

الإجابة: س8: X خطأ

خطوات الحل:

  1. **الشرح:** العبارة تقول: "تشير بحيرة البيانات إلى قاعدة البيانات التي تخزن البيانات الحالية والتاريخية الناتجة عن أنظمة المعاملات الأساسية في المؤسسة." لنفرق بين المفهومين: - بحيرة البيانات (Data Lake): تخزن بيانات أولية غير مهيكلة وشبه مهيكلة ومهيكلة - مستودع البيانات (Data Warehouse): هو الذي يخزن بيانات منظمة ومعالجة من أنظمة المعاملات العبارة تصف مستودع البيانات وليس بحيرة البيانات. إذن العبارة **غير صحيحة** لأنها أعطت تعريفًا لمستودع البيانات وليس بحيرة البيانات.

سؤال 9: اختيار البيانات هو تحديد جزء من مجموعة البيانات الذي نريد استخدامه لعملية اكتشاف المعرفة.

الإجابة: س9: ✓ صح

خطوات الحل:

  1. **الشرح:** لننظر إلى العبارة: "اختيار البيانات هو تحديد جزء من مجموعة البيانات الذي نريد استخدامه لعملية اكتشاف المعرفة." الفكرة هنا هي مرحلة "اختيار البيانات" (Data Selection) في عملية اكتشاف المعرفة: - هذه المرحلة تسبق عملية التنقيب - يتم فيها تحديد البيانات ذات الصلة بالمشكلة - تُستبعد البيانات غير الضرورية لتحسين الكفاءة هذا التعريف دقيق ويصف المرحلة بشكل صحيح. إذن العبارة **صحيحة** لأنها تعطي تعريفًا صحيحًا لمرحلة اختيار البيانات.

سؤال 10: تمثيل المعرفة هو عملية استخراج البيانات من خلال تحليلات الأنماط.

الإجابة: س10: X خطأ

خطوات الحل:

  1. **الشرح:** السؤال يقول: "تمثيل المعرفة هو عملية استخراج البيانات من خلال تحليلات الأنماط." لنفهم الفرق بين المفهومين: - تمثيل المعرفة (Knowledge Representation): هو كيفية تنظيم وتخزين المعرفة في شكل يمكن للحاسوب معالجته - تنقيب البيانات (Data Mining): هو عملية استخراج الأنماط والمعرفة من البيانات العبارة تصف تنقيب البيانات وليس تمثيل المعرفة. إذن العبارة **غير صحيحة** لأنها خلطت بين مفهومي تمثيل المعرفة وتنقيب البيانات.

🎴 بطاقات تعليمية للمراجعة

عدد البطاقات: 10 بطاقة لهذه الصفحة

بناءً على مفاهيم تخزين البيانات الضخمة، أي مصطلح مما يلي يصف المستودع الذي يُستخدم لتخزين كميات هائلة من البيانات في حالتها 'الأولية وغير المعالجة'؟

  • أ) مستودع البيانات (Data Warehouse)
  • ب) بحيرة البيانات (Data Lake)
  • ج) الحوسبة في الذاكرة (In-Memory Computing)
  • د) نظام المعاملات الأساسية (Transactional System)

الإجابة الصحيحة: b

الإجابة: بحيرة البيانات (Data Lake)

الشرح: ١. مستودع البيانات (Data Warehouse) يُخزن بيانات مهيكلة ومعالجة مسبقاً لأغراض التحليل. ٢. بحيرة البيانات (Data Lake) هي التي تستوعب كميات ضخمة من البيانات الأولية (Raw Data) وغير المعالجة بمختلف تنسيقاتها. ٣. ورد في الصفحة أن وصف مستودع البيانات بالبيانات غير المعالجة هو خطأ، والصحيح هو بحيرة البيانات.

تلميح: فكر في الفرق بين البيانات المهيكلة الجاهزة للتحليل والبيانات الخام التي لم تُعالج بعد.

التصنيف: فرق بين مفهومين | المستوى: متوسط

أي من المصطلحات التالية يشير إلى المستودع الذي يُستخدم لتخزين كميات هائلة من البيانات في صورتها "الأولية وغير المعالجة" وبمختلف أشكالها؟

  • أ) مستودع البيانات (Data Warehouse)
  • ب) بحيرة البيانات (Data Lake)
  • ج) الحوسبة في الذاكرة (In-Memory Computing)
  • د) تكامل البيانات (Data Integration)

الإجابة الصحيحة: b

الإجابة: بحيرة البيانات (Data Lake)

الشرح: ١. مستودع البيانات (Data Warehouse) مخصص للبيانات المهيكلة والمعالجة التي تم تنظيمها مسبقاً لأغراض التحليل. ٢. بحيرة البيانات (Data Lake) هي التي تسمح بتخزين البيانات الضخمة بمختلف أشكالها (مهيكلة، شبه مهيكلة، غير مهيكلة) في صورتها الأولية الخام. ٣. بناءً على التعريف العلمي، فإن تخزين البيانات غير المعالجة هو الوظيفة الأساسية لبحيرة البيانات وليس مستودع البيانات.

تلميح: فرق بين المستودع الذي يخزن بيانات منظمة وجاهزة للتحليل، والمستودع الذي يستوعب البيانات كما هي في حالتها الخام.

التصنيف: فرق بين مفهومين | المستوى: متوسط

أي من العبارات التالية تصف بدقة الفرق بين مستودع البيانات (Data Warehouse) وبحيرة البيانات (Data Lake) من حيث معالجة البيانات؟

  • أ) مستودع البيانات يخزن بيانات أولية غير معالجة، بينما بحيرة البيانات تخزن بيانات تاريخية منظمة.
  • ب) مستودع البيانات يخزن بيانات منظمة ومعالجة، بينما بحيرة البيانات تخزن بيانات أولية وغير معالجة.
  • ج) كلاهما يخزن البيانات بنفس الطريقة، والفرق الوحيد هو أن مستودع البيانات يكون سحابياً دائماً.
  • د) بحيرة البيانات هي جزء صغير من مستودع البيانات مخصص للبيانات الحالية فقط.

الإجابة الصحيحة: b

الإجابة: مستودع البيانات يخزن بيانات منظمة ومعالجة، بينما بحيرة البيانات تخزن بيانات أولية وغير معالجة.

الشرح: 1. مستودع البيانات (Data Warehouse): مصمم لتخزين البيانات التي تمت معالجتها وهيكلتها لتناسب أغراض تحليلية محددة. 2. بحيرة البيانات (Data Lake): تعمل كمخزن هائل للبيانات في صورتها الطبيعية (الأولية) دون معالجة مسبقة. 3. الخيار الصحيح يعكس التصحيح العلمي للخطأ الوارد في التمارين رقم 6 و 8 في الكتاب الدراسي.

تلميح: فكر في أي المفهومين يتطلب 'تنظيم البيانات' قبل تخزينها، وأيهما يسمح بتخزين البيانات 'خام' كما هي.

التصنيف: فرق بين مفهومين | المستوى: متوسط

أي من العبارات التالية تصف الفرق الجوهري بين مستودع البيانات (Data Warehouse) وبحيرة البيانات (Data Lake)؟

  • أ) مستودع البيانات يخزن بيانات أولية فقط، بينما بحيرة البيانات تخزن تقارير نهائية.
  • ب) مستودع البيانات يخزن بيانات منظمة ومعالجة، بينما بحيرة البيانات تخزن بيانات أولية وغير معالجة.
  • ج) كلاهما يقومان بتخزين البيانات الأولية فقط ولا يمكن استخدامهما للبيانات المهيكلة.
  • د) بحيرة البيانات مخصصة للبيانات الورقية، بينما مستودع البيانات مخصص للبيانات الرقمية.

الإجابة الصحيحة: b

الإجابة: مستودع البيانات يخزن بيانات منظمة ومعالجة، بينما بحيرة البيانات تخزن بيانات أولية وغير معالجة.

الشرح: ١. مستودع البيانات (Data Warehouse): يُستخدم لتخزين البيانات المنظمة والمهيكلة التي تمت معالجتها لتناسب أغراض التحليل. ٢. بحيرة البيانات (Data Lake): تُستخدم لتخزين كميات هائلة من البيانات في شكلها الأصلي (الخام) سواء كانت منظمة أو غير منظمة. ٣. بناءً عليه، فإن التمييز الأساسي يعتمد على درجة معالجة وهيكلة البيانات قبل تخزينها.

تلميح: فكر في حالة البيانات؛ هل هي خام (Raw) أم مهيكلة وجاهزة للتحليل (Processed)؟

التصنيف: فرق بين مفهومين | المستوى: متوسط

ما الفرق الجوهري بين 'بحيرة البيانات' (Data Lake) و'مستودع البيانات' (Data Warehouse) من حيث حالة البيانات المخزنة؟

  • أ) تخزن بحيرة البيانات البيانات الأولية وغير المعالجة، بينما يخزن مستودع البيانات البيانات المهيكلة والمعالجة.
  • ب) تخزن بحيرة البيانات البيانات المعالجة فقط، بينما يخصص مستودع البيانات للبيانات غير المهيكلة.
  • ج) كلاهما يقومان بتخزين البيانات الأولية فقط، ولكن مستودع البيانات يعمل حصرياً عبر التخزين السحابي.
  • د) تعتمد بحيرة البيانات على ذاكرة الوصول العشوائي (RAM)، بينما يعتمد مستودع البيانات على الأقراص الصلبة فقط.

الإجابة الصحيحة: a

الإجابة: تخزن بحيرة البيانات البيانات الأولية وغير المعالجة، بينما يخزن مستودع البيانات البيانات المهيكلة والمعالجة.

الشرح: 1. بحيرة البيانات (Data Lake): هي مستودع مخصص لتخزين البيانات في صورتها الأولية (Raw Data) وغير المعالجة وبمختلف تنسيقاتها. 2. مستودع البيانات (Data Warehouse): هو نظام يخزن البيانات التي تمت معالجتها وهيكلتها لتكون جاهزة لعمليات التحليل وإعداد التقارير. 3. الخيار الصحيح يوضح أن البحيرة للبيانات الخام والمستودع للبيانات المنظمة.

تلميح: فكر في أي منهما يستقبل البيانات بصورتها الخام وأيهما يتطلب تنظيماً مسبقاً للتحليل.

التصنيف: فرق بين مفهومين | المستوى: متوسط

ما هي التقنية التي تُستخدم لتسهيل تحليل البيانات الضخمة عبر الاعتماد بشكل أساسي على ذاكرة الوصول العشوائي (RAM) لتخزين البيانات بدلاً من وحدات التخزين التقليدية؟

  • أ) التخزين السحابي
  • ب) الحوسبة في الذاكرة
  • ج) مستودع البيانات
  • د) بحيرة البيانات

الإجابة الصحيحة: b

الإجابة: الحوسبة في الذاكرة

الشرح: ١. تعتمد هذه التقنية على تخزين البيانات في الذاكرة الرئيسية (RAM). ٢. RAM أسرع بكثير من الأقراص الصلبة، مما يقلل وقت معالجة البيانات الضخمة. ٣. تسمى هذه الطريقة علمياً بـ "الحوسبة في الذاكرة" (In-Memory Computing).

تلميح: ابحث عن التقنية التي تستخدم الذاكرة الرئيسية للحاسب لتسريع الوصول للبيانات.

التصنيف: مفهوم جوهري | المستوى: متوسط

ما الفرق الجوهري بين 'بحيرة البيانات' (Data Lake) و 'مستودع البيانات' (Data Warehouse) من حيث حالة البيانات المخزنة؟

  • أ) بحيرة البيانات تخزن بيانات معالجة، بينما مستودع البيانات يخزن بيانات أولية.
  • ب) بحيرة البيانات تخزن بيانات أولية وغير معالجة، بينما مستودع البيانات يخزن بيانات منظمة ومعالجة.
  • ج) كلاهما يستخدمان لتخزين البيانات الأولية فقط دون أي فرق في المعالجة.
  • د) مستودع البيانات يعتمد على الذاكرة العشوائية RAM، بينما بحيرة البيانات تعتمد على الأقراص الصلبة.

الإجابة الصحيحة: b

الإجابة: بحيرة البيانات تخزن بيانات أولية وغير معالجة، بينما مستودع البيانات يخزن بيانات منظمة ومعالجة.

الشرح: ١. بحيرة البيانات (Data Lake): مخصصة لتخزين البيانات في حالتها الأصلية/الأولية (Raw) بمختلف تنسيقاتها. ٢. مستودع البيانات (Data Warehouse): يُستخدم لتخزين البيانات التي تم تنظيفها وتنظيمها وهيكلتها لتسهيل عمليات التحليل وإصدار التقارير. ٣. بناءً على محتوى الكتاب، خلط التعريفات بينهما يعد خطأً علمياً شائعاً يجب الحذر منه.

تلميح: فكر في أي منهما يعمل كخزان للمواد الخام (Raw) وأيهما يعمل كمخزن للمنتجات الجاهزة للتحليل.

التصنيف: فرق بين مفهومين | المستوى: متوسط

أي من العبارات التالية تصف "بحيرة البيانات" (Data Lake) بشكل دقيق وتميزها عن "مستودع البيانات"؟

  • أ) قاعدة بيانات تخزن فقط البيانات التاريخية المنظمة والمعالجة الناتجة عن المعاملات.
  • ب) مستودع يهدف لتخزين كميات ضخمة من البيانات الأولية وغير المعالجة بأشكالها المختلفة.
  • ج) تقنية تعتمد على ذاكرة الوصول العشوائي (RAM) لتسريع عمليات تحليل البيانات.
  • د) عملية آلية تهدف لاستخراج الأنماط والمعرفة من البيانات الضخمة.

الإجابة الصحيحة: b

الإجابة: مستودع يهدف لتخزين كميات ضخمة من البيانات الأولية وغير المعالجة بأشكالها المختلفة.

الشرح: ١. بحيرة البيانات (Data Lake) تُستخدم لتخزين البيانات في صورتها الخام أو الأولية (Raw Data) دون معالجة مسبقة. ٢. مستودع البيانات (Data Warehouse) يُستخدم لتخزين البيانات المنظمة والمعالجة التي تم تجهيزها للتحليل. ٣. وفقاً للمنهج، فإن وصف مستودع البيانات بأنه للبيانات غير المعالجة هو وصف خاطئ، والصواب أن هذا هو دور بحيرة البيانات.

تلميح: فكر في نوع البيانات (أولية أم معالجة) التي يتم تخزينها في كل منهما.

التصنيف: فرق بين مفهومين | المستوى: متوسط

أي من العبارات التالية تصف الفرق الجوهري بين «مستودع البيانات» (Data Warehouse) و «بحيرة البيانات» (Data Lake) من حيث طبيعة البيانات المخزنة؟

  • أ) يخزن مستودع البيانات بيانات أولية غير معالجة، بينما تخزن بحيرة البيانات بيانات منظمة ومهيكلة فقط لسهولة الوصول إليها.
  • ب) يخزن مستودع البيانات بيانات مهيكلة ومعالجة، بينما تخزن بحيرة البيانات بيانات أولية وغير معالجة بتنسيقات مختلفة.
  • ج) يقتصر استخدام مستودعات البيانات على التخزين السحابي فقط، بينما تُستخدم بحيرات البيانات حصرياً للتخزين المحلي داخل المؤسسات.
  • د) لا يوجد فرق حقيقي في نوع البيانات المخزنة، والفرق الوحيد هو أن بحيرة البيانات مخصصة للبيانات التاريخية فقط.

الإجابة الصحيحة: b

الإجابة: يخزن مستودع البيانات بيانات مهيكلة ومعالجة، بينما تخزن بحيرة البيانات بيانات أولية وغير معالجة بتنسيقات مختلفة.

الشرح: ١. مستودع البيانات (Data Warehouse): يُخزن بيانات منظمة ومعالجة ومهيكلة تم جمعها من أنظمة المعاملات لأغراض التحليل. ٢. بحيرة البيانات (Data Lake): تُخزن كميات هائلة من البيانات الأولية (Raw Data) وغير المعالجة بتنسيقاتها الأصلية (مهيكلة، شبه مهيكلة، أو غير مهيكلة). ٣. بناءً عليه، فإن مستودع البيانات مخصص للبيانات الجاهزة، والبحيرة للبيانات الخام.

تلميح: فكر في حالة البيانات؛ هل هي جاهزة ومُنظمة للتحليل أم أنها في صورتها الخام والأصلية؟

التصنيف: فرق بين مفهومين | المستوى: متوسط

ما هو المصطلح العلمي الذي يصف مستودعاً لتخزين كميات هائلة من البيانات الأولية وغير المعالجة (Raw Data) بتنسيقاتها الأصلية؟

  • أ) مستودع البيانات (Data Warehouse)
  • ب) بحيرة البيانات (Data Lake)
  • ج) الحوسبة في الذاكرة (In-Memory Computing)
  • د) تمثيل المعرفة (Knowledge Representation)

الإجابة الصحيحة: b

الإجابة: بحيرة البيانات (Data Lake)

الشرح: ١. بحيرة البيانات (Data Lake) هي التي تخزن البيانات الأولية وغير المعالجة بمختلف أشكالها. ٢. مستودع البيانات (Data Warehouse) مخصص للبيانات المهيكلة والمنظمة التي تمت معالجتها. ٣. العبارة الواردة في الكتاب خلطت بينهما، حيث وصفت بحيرة البيانات بكونها مستودع بيانات. ٤. الإجابة الصحيحة للوصف المعطى هي بحيرة البيانات.

تلميح: فكر في الفرق بين تخزين البيانات 'الخام' وتخزين البيانات 'المنظمة والمعالجة'.

التصنيف: فرق بين مفهومين | المستوى: متوسط