📝 ملخص الصفحة
📚 مستودعات البيانات والحوسبة في الذاكرة والتنقيب في البيانات الضخمة
المفاهيم الأساسية
مستودع البيانات (Data Warehouse): قاعدة بيانات تخزن البيانات الحالية والتاريخية من أنظمة تشغيلية مختلفة (مثل المبيعات، التصنيع) ومصادر خارجية، بعد تحويلها إلى بيانات منظمة، لتكون متاحة لصانعي القرار. يوفر أدوات للتحليل والاستعلام وإعداد التقارير.
الحوسبة في الذاكرة (In-Memory Computing): طريقة لتحليل البيانات الضخمة تعتمد على تخزين البيانات في الذاكرة الرئيسية (RAM)، مما يتجاوز معوقات التخزين على الأقراص ويقلل وقت الاستعلام بشكل كبير.
بحيرة البيانات (Data Lake): مستودع بيانات (غالبًا سحابي) لتخزين كميات هائلة من البيانات الأولية وغير المعالجة (منظمة وغير منظمة) باستخدام عنوان URL ثابت.
التنقيب في البيانات (Data Mining): خطوة في عملية اكتشاف المعرفة، تشير إلى تطبيق خوارزميات محددة لاستخراج الأنماط وتحديد العلاقات داخل البيانات.
خريطة المفاهيم
```markmap
البيانات الضخمة (Big Data)
التعريف
- بيانات كبيرة جدًا أو معقدة
- لا يمكن معالجتها بالطرق التقليدية
- تخزينها ومعالجتها تحدي كبير
الخصائص الخمس (5V's)
التنوع (Variety)
- أنواع مختلفة من البيانات
- منظمة (قواعد بيانات تقليدية)
- غير منظمة (نصوص، صوت، فيديو)
- شبه منظمة
القيمة (Value)
- الفائدة المستخلصة من البيانات لاتخاذ القرارات
- استخراج التوصيات والأفكار عبر التحليل
الحجم (Volume)
- كميات هائلة من البيانات غير المنظمة قليلة الكثافة
- قد تصل إلى عشرات أو مئات التيرابايت
- مصدرها: تصفح الويب، تطبيقات الهاتف، أجهزة إنترنت الأشياء
الموثوقية (Veracity)
- دقة وصدق مجموعة البيانات
- تعتمد على مصداقية المصدر ونوع البيانات وكيفية معالجتها
السرعة (Velocity)
- معدل التقاط البيانات وتخزينها
- تنتج من الأجهزة الذكية في الوقت الحقيقي أو قريب منه
تقنيات إدارة البيانات الضخمة
الهدف
- استخراج قيمة الأعمال من البيانات
- تحسين تجربة الشراء وجذب الزبائن
- اتخاذ قرارات مدروسة (تعديل الأسعار، الحملات التسويقية)
مصادر البيانات
- داخلية: المبيعات، التصنيع، المحاسبة
- خارجية: إحصاءات سكانية، بيانات المنافسين
البنية التحتية والتقنيات
#### مستودعات البيانات (Data Warehouses)
- تخزن البيانات الحالية والتاريخية من الأنظمة التشغيلية
- بيانات منظمة ومتكاملة من مصادر داخلية وخارجية
- أدوات للتحليل والاستعلام وإعداد التقارير
#### بحيرات البيانات (Data Lakes)
- مستودع سحابي عادةً
- تخزين كميات هائلة من البيانات الأولية وغير المعالجة
- تدعم البيانات المنظمة وغير المنظمة بعنوان URL ثابت
#### الحوسبة في الذاكرة (In-memory Computing)
- تعتمد على ذاكرة الوصول العشوائي (RAM) لتخزين البيانات
- تقلل وقت الاستعلام بشكل كبير
- مناسبة للخوادم السحابية ذات السعة الكبيرة من الذاكرة
اكتشاف المعرفة والتنقيب في البيانات
#### اكتشاف المعرفة
- العملية الشاملة للوصول إلى المعرفة المفيدة من البيانات
- خطواتها: تنظيف البيانات، تكامل البيانات، تحويل الصيغة، التنقيب، تفسير النتائج
#### التنقيب في البيانات (Data Mining)
- خطوة محددة في عملية اكتشاف المعرفة
- تطبيق خوارزميات لاستخراج الأنماط وتحديد العلاقات داخل البيانات
##### المهام الرئيسة للتنقيب في البيانات
- تحليل البيانات لاكتشاف الأنماط والاتجاهات
- صياغة التنبؤات لمدخلات مجموعات البيانات المختلفة
- تصنيف أو تجميع أو توقع القيم المختلفة لمجموعة البيانات
- تسهيل عملية اتخاذ القرارات المدروسة
```
نقاط مهمة
- مستودع البيانات هو أداة قديمة لتحليل بيانات الشركات.
- يتم اختيار إحدى تقنيات إدارة البيانات (مستودع، بحيرة، حوسبة في الذاكرة) اعتمادًا على نوع الشركة وطبيعة احتياجاتها.
- التنقيب في البيانات هو جزء من عملية أوسع تسمى "اكتشاف المعرفة"، والتي تشمل خطوات أخرى ضرورية مثل تنظيف البيانات وتفسير النتائج.
📋 المحتوى المنظم
📖 محتوى تعليمي مفصّل
مستودعات البيانات Data Warehouse
نوع: محتوى تعليمي
مستودعات البيانات Data Warehouse
نوع: محتوى تعليمي
قد تُعد مستودعات البيانات الأداة الأقدم لتحليل بيانات الشركات. يشير مستودع البيانات إلى قاعدة البيانات التي تخزن البيانات الحالية والتاريخية التي نتجت عن العديد من أنظمة المعاملات التشغيلية الأساسية مثل أنظمة المبيعات، ودعم العملاء، والتصنيع، والتي تجعل البيانات متاحة لصانعي القرار في الشركة. ويتم دمج هذه البيانات مع البيانات من المصادر الخارجية لتحويل البيانات غير المكتملة إلى بيانات منظمة قبل تخزينها في مستودع البيانات. يوفر نظام مستودع البيانات أيضًا مجموعة من الأدوات للتحليل والاستعلام وكذلك أدوات إعداد التقارير الرسومية.
الحوسبة في الذاكرة In-Memory Computing
نوع: محتوى تعليمي
الحوسبة في الذاكرة In-Memory Computing
نوع: محتوى تعليمي
هي طريقة لتسهيل عملية تحليل البيانات الضخمة بالاعتماد بصورة أساسية على ذاكرة الحاسب الرئيسة مثل ذاكرة الوصول العشوائي (RAM) لتخزين البيانات. يصل المستخدمون إلى البيانات المخزنة في الذاكرة الأساسية للنظام وبالتالي يتم تجاوز معوقات استرداد وقراءة البيانات الموجودة في قاعدة البيانات التقليدية المستندة إلى التخزين على الأقراص مما يعني تقليل وقت الاستعلام بشكل كبير. تتميز الخوادم السحابية بشكل خاص بوجود سعة كبيرة من ذاكرة الوصول العشوائي، مما يسهل استخدامها في عمليات الحوسبة في الذاكرة.
بحيرة البيانات Data Lake
نوع: محتوى تعليمي
بحيرة البيانات Data Lake
نوع: محتوى تعليمي
بحيرة البيانات هي مستودع بيانات عادة ما يكون سحابيًا يُستخدم لتخزين كميات هائلة من البيانات الأولية وغير المعالجة. في هذه الطريقة يتم استخدام عنوان URL ثابت لدعم كل من البيانات المنظمة (مثل قواعد البيانات) والبيانات غير المنظمة (مثل رسائل البريد الإلكتروني والمستندات).
نوع: محتوى تعليمي
يُعد التمييز بين هذه التقنيات الثلاثة مهمًا نظرًا للأغراض المختلفة لاستخدامها ولكيفية عملها في معالجة البيانات بشكل صحيح. لا تعمل هذه التقنيات معًا، ولكن يتم اختيار إحداها اعتمادًا على نوع الشركة. فقد تكون بحيرة البيانات هي الخيار الجيد لإحدى الشركات، بينما يعد مستودع البيانات الخيار الأفضل لشركة أخرى.
التنقيب في البيانات الضخمة Mining Big Data
نوع: محتوى تعليمي
التنقيب في البيانات الضخمة Mining Big Data
نوع: محتوى تعليمي
كما عرفت سابقًا، يتم جمع البيانات الضخمة باستمرار بواسطة أجهزة الاستشعار والتطبيقات العامة والتطبيقات الشخصية. إن عملية جمع البيانات ليست سوى الخطوة الأولى في العملية المشار إليها باسم اكتشاف المعرفة. يشير اكتشاف المعرفة إلى العملية الشاملة للوصول إلى المعرفة المفيدة من البيانات. ويشير التنقيب في البيانات إلى خطوة معينة في هذه العملية. فالتنقيب عن البيانات هو تطبيق لخوارزميات محددة لاستخراج الأنماط من البيانات، وتحديد العلاقات المختلفة داخل هذه البيانات. تُعد الخطوات الأخرى في عملية اكتشاف المعرفة مثل تنظيف البيانات، وتكامل البيانات، وتحويل صيغة البيانات، والتفسير الصحيح لنتائج التنقيب ضرورية لضمان اشتقاق المعرفة المفيدة من البيانات (انظر الجدول 1.6).
بعض المهام الرئيسة التي يتم إنجازها عن طريق التنقيب في البيانات
نوع: محتوى تعليمي
بعض المهام الرئيسة التي يتم إنجازها عن طريق التنقيب في البيانات
وزارة التعليم
نوع: NON_EDUCATIONAL
وزارة التعليم Ministry of Education 2025 - 1447
🔍 عناصر مرئية
التنقيب في البيانات (Data Mining)
A conceptual diagram titled 'التنقيب في البيانات (Data Mining)' with an accompanying text box providing its definition. The text box content is: 'عملية اكتشاف الأنماط في كمية كبيرة من البيانات واستخراج المعلومات المفيدة في توقع السلوك المستقبلي.'
بعض المهام الرئيسة التي يتم إنجازها عن طريق التنقيب في البيانات
A table listing the main tasks performed through data mining, as referenced by 'الجدول 1.6' in the main text.
وزارة التعليم
Logo of the Ministry of Education with text 'وزارة التعليم Ministry of Education 2025 - 1447'.
🎴 بطاقات تعليمية للمراجعة
عدد البطاقات: 5 بطاقة لهذه الصفحة
ما هو تعريف مستودع البيانات (Data Warehouse)؟
- أ) مستودع سحابي لتخزين كميات هائلة من البيانات الأولية غير المعالجة فقط.
- ب) قاعدة بيانات تخزن البيانات الحالية والتاريخية من أنظمة المعاملات التشغيلية، وتدمجها مع بيانات خارجية، لتصبح متاحة لصانعي القرار.
- ج) طريقة لتحليل البيانات تعتمد كلياً على ذاكرة الوصول العشوائي (RAM) لتخزين البيانات.
- د) عملية تطبيق خوارزميات محددة لاستخراج الأنماط من البيانات.
الإجابة الصحيحة: b
الإجابة: قاعدة بيانات تخزن البيانات الحالية والتاريخية من أنظمة المعاملات التشغيلية، وتدمجها مع بيانات خارجية، لتصبح متاحة لصانعي القرار.
الشرح: 1. مستودع البيانات هو قاعدة بيانات. 2. يخزن بيانات حالية وتاريخية من أنظمة تشغيلية (مبيعات، دعم عملاء، تصنيع). 3. يدمج بيانات من مصادر خارجية. 4. الهدف الأساسي هو جعل البيانات منظمة ومتاحة لصانعي القرار.
تلميح: فكر في أداة تخزين وتحليل بيانات الشركات.
التصنيف: تعريف | المستوى: سهل
ما المفهوم الأساسي الذي تميزه الحوسبة في الذاكرة (In-Memory Computing)؟
- أ) دمج البيانات من مصادر خارجية لتحويلها إلى بيانات منظمة قبل التخزين.
- ب) تخزين البيانات الأولية وغير المعالجة باستخدام عنوان URL ثابت.
- ج) اعتمادها الأساسي على ذاكرة الحاسب الرئيسة (RAM) لتخزين البيانات، مما يقلل وقت الاستعلام بشكل كبير.
- د) تطبيق خوارزميات لاستخراج الأنماط من البيانات دون الحاجة إلى تنظيفها أولاً.
الإجابة الصحيحة: c
الإجابة: اعتمادها الأساسي على ذاكرة الحاسب الرئيسة (RAM) لتخزين البيانات، مما يقلل وقت الاستعلام بشكل كبير.
الشرح: 1. الحوسبة في الذاكرة تعتمد على ذاكرة الحاسب الرئيسة (RAM). 2. تخزن البيانات في الذاكرة الأساسية للنظام. 3. تتجاوز معوقات قراءة البيانات من الأقراص التقليدية. 4. النتيجة: تقليل وقت الاستعلام بشكل كبير.
تلميح: تتعلق بطريقة تخزين البيانات لتحسين سرعة الوصول إليها.
التصنيف: مفهوم جوهري | المستوى: متوسط
ما الفرق الرئيسي بين بحيرة البيانات (Data Lake) ومستودع البيانات (Data Warehouse)؟
- أ) بحيرة البيانات تعتمد على RAM بينما مستودع البيانات يعتمد على التخزين السحابي.
- ب) بحيرة البيانات تخزن كميات هائلة من البيانات الأولية وغير المعالجة (منظمة وغير منظمة)، بينما مستودع البيانات يخزن بيانات منظمة ومدمجة جاهزة للتحليل.
- ج) بحيرة البيانات تستخدم فقط للبيانات التاريخية، بينما مستودع البيانات للبيانات الحالية فقط.
- د) بحيرة البيانات مخصصة للشركات الصغيرة، بينما مستودع البيانات للشركات الكبيرة فقط.
الإجابة الصحيحة: b
الإجابة: بحيرة البيانات تخزن كميات هائلة من البيانات الأولية وغير المعالجة (منظمة وغير منظمة)، بينما مستودع البيانات يخزن بيانات منظمة ومدمجة جاهزة للتحليل.
الشرح: 1. بحيرة البيانات: تخزن بيانات أولية (خام) وغير معالجة. 2. تدعم البيانات المنظمة وغير المنظمة. 3. مستودع البيانات: يخزن بيانات منظمة ومدمجة من مصادر تشغيلية وخارجية. 4. البيانات في مستودع البيانات جاهزة للتحليل واتخاذ القرار.
تلميح: فكر في حالة البيانات عند التخزين.
التصنيف: فرق بين مفهومين | المستوى: متوسط
ما العلاقة بين اكتشاف المعرفة (Knowledge Discovery) والتنقيب في البيانات (Data Mining)؟
- أ) التنقيب في البيانات هو العملية الشاملة، واكتشاف المعرفة هو خطوة فيها.
- ب) التنقيب في البيانات هو خطوة معينة ضمن العملية الشاملة لاكتشاف المعرفة.
- ج) هما مصطلحان مختلفان لنفس المفهوم تماماً.
- د) اكتشاف المعرفة يسبق جمع البيانات، بينما التنقيب في البيانات يلي جمعها مباشرة.
الإجابة الصحيحة: b
الإجابة: التنقيب في البيانات هو خطوة معينة ضمن العملية الشاملة لاكتشاف المعرفة.
الشرح: 1. اكتشاف المعرفة هو العملية الشاملة للوصول إلى المعرفة المفيدة من البيانات. 2. التنقيب في البيانات هو خطوة (مرحلة) محددة داخل هذه العملية. 3. خطوات أخرى في اكتشاف المعرفة تشمل تنظيف البيانات، تكاملها، وتحويل صيغتها.
تلميح: أيهما أشمل وأيهما جزء منه؟
التصنيف: مفهوم جوهري | المستوى: صعب
أي مما يلي يعد من المهام الرئيسة للتنقيب في البيانات (Data Mining)؟
- أ) تخزين البيانات الأولية في مستودعات سحابية.
- ب) تحليل البيانات لاكتشاف الأنماط والاتجاهات.
- ج) استبدال ذاكرة RAM بأقراص تخزين أسرع.
- د) دمج أنظمة تشغيلية مختلفة في نظام واحد.
الإجابة الصحيحة: b
الإجابة: تحليل البيانات لاكتشاف الأنماط والاتجاهات.
الشرح: 1. التنقيب في البيانات هو تطبيق خوارزميات لاستخراج الأنماط من البيانات. 2. من مهامه الرئيسة: تحليل البيانات لاكتشاف الأنماط والاتجاهات المخفية. 3. مهام أخرى تشمل: صياغة التنبؤات، وتصنيف أو تجميع البيانات.
تلميح: فكر في الهدف الأساسي من تطبيق الخوارزميات على البيانات.
التصنيف: مفهوم جوهري | المستوى: سهل