الجدول 1.6: خطوات اكتشاف المعرفة - كتاب علم البيانات - الصف 11 - الفصل 1 - المملكة العربية السعودية

الكتاب: كتاب علم البيانات - الصف 11 - الفصل 1 | المادة: علم البيانات | المرحلة: الصف 11 | الفصل الدراسي: 1

الدولة: المملكة العربية السعودية | المنهج: المنهج السعودي - وزارة التعليم

الدرس: الجدول 1.6: خطوات اكتشاف المعرفة

📚 معلومات الصفحة

الكتاب: كتاب علم البيانات - الصف 11 - الفصل 1 | المادة: علم البيانات | المرحلة: الصف 11 | الفصل الدراسي: 1

الدولة: المملكة العربية السعودية | المنهج: المنهج السعودي - وزارة التعليم

نوع المحتوى: درس تعليمي

📝 ملخص الصفحة

📚 البيانات الضخمة والتخزين السحابي

المفاهيم الأساسية

التخزين السحابي: الحل الأمثل لتخزين البيانات الضخمة، حيث يتم نقل البيانات وتحليلها عبر الإنترنت بدلاً من تخزينها داخلياً على خوادم الشركة.

خريطة المفاهيم

```markmap

البيانات الضخمة (Big Data)

التعريف

  • بيانات كبيرة جدًا أو معقدة
  • لا يمكن معالجتها بالطرق التقليدية
  • تخزينها ومعالجتها تحدي كبير

الخصائص الخمس (5V's)

التنوع (Variety)

  • أنواع مختلفة من البيانات
  • منظمة (قواعد بيانات تقليدية)
  • غير منظمة (نصوص، صوت، فيديو)
  • شبه منظمة

القيمة (Value)

  • الفائدة المستخلصة من البيانات لاتخاذ القرارات
  • استخراج التوصيات والأفكار عبر التحليل

الحجم (Volume)

  • كميات هائلة من البيانات غير المنظمة قليلة الكثافة
  • قد تصل إلى عشرات أو مئات التيرابايت
  • مصدرها: تصفح الويب، تطبيقات الهاتف، أجهزة إنترنت الأشياء

الموثوقية (Veracity)

  • دقة وصدق مجموعة البيانات
  • تعتمد على مصداقية المصدر ونوع البيانات وكيفية معالجتها

السرعة (Velocity)

  • معدل التقاط البيانات وتخزينها
  • تنتج من الأجهزة الذكية في الوقت الحقيقي أو قريب منه

تقنيات إدارة البيانات الضخمة

الهدف

  • استخراج قيمة الأعمال من البيانات
  • تحسين تجربة الشراء وجذب الزبائن
  • اتخاذ قرارات مدروسة (تعديل الأسعار، الحملات التسويقية)

مصادر البيانات

  • داخلية: المبيعات، التصنيع، المحاسبة
  • خارجية: إحصاءات سكانية، بيانات المنافسين

البنية التحتية والتقنيات

#### مستودعات البيانات (Data Warehouses)

  • تخزن البيانات الحالية والتاريخية من الأنظمة التشغيلية
  • بيانات منظمة ومتكاملة من مصادر داخلية وخارجية
  • أدوات للتحليل والاستعلام وإعداد التقارير
#### بحيرات البيانات (Data Lakes)

  • مستودع سحابي عادةً
  • تخزين كميات هائلة من البيانات الأولية وغير المعالجة
  • تدعم البيانات المنظمة وغير المنظمة بعنوان URL ثابت
#### الحوسبة في الذاكرة (In-memory Computing)

  • تعتمد على ذاكرة الوصول العشوائي (RAM) لتخزين البيانات
  • تقلل وقت الاستعلام بشكل كبير
  • مناسبة للخوادم السحابية ذات السعة الكبيرة من الذاكرة

اكتشاف المعرفة والتنقيب في البيانات

#### اكتشاف المعرفة

  • العملية الشاملة للوصول إلى المعرفة المفيدة من البيانات
  • خطواتها: تنظيف البيانات، تكامل البيانات، تحويل الصيغة، التنقيب، تفسير النتائج
#### التنقيب في البيانات (Data Mining)

  • خطوة محددة في عملية اكتشاف المعرفة
  • تطبيق خوارزميات لاستخراج الأنماط وتحديد العلاقات داخل البيانات
##### المهام الرئيسة للتنقيب في البيانات

  • تحليل البيانات لاكتشاف الأنماط والاتجاهات
  • صياغة التنبؤات لمدخلات مجموعات البيانات المختلفة
  • تصنيف أو تجميع أو توقع القيم المختلفة لمجموعة البيانات
  • تسهيل عملية اتخاذ القرارات المدروسة

التخزين السحابي (Cloud Storage)

خيارات التخزين

  • التخزين الداخلي (التقليدي)
  • التخزين السحابي (الأمثل)

أسباب تفوق التخزين السحابي

  • توافر النطاق العريض عالي السرعة
  • سهولة نقل البيانات وتحليلها سحابياً
  • اعتماد غالبية التطبيقات الحديثة عليه

مزاياه للشركات

  • يشمل أنظمة تخزين البيانات الضخمة
  • يشمل أنظمة النسخ الاحتياطي
  • يوفر حماية البيانات والخصوصية
  • قابل للتوسع
  • تكلفة معقولة

أمثلة على مزودي الخدمة

  • أمازون (Amazon)
  • مايكروسوفت (Microsoft)
  • قوقل (Google)
```

نقاط مهمة

  • كان التخزين الداخلي (على خوادم داخل الشركة) هو المعتمد سابقاً، لكنه يتطلب مستودعات محلية عالية التكلفة وبرامج إدارة معقدة.
  • ساهم توفر الإنترنت عالي السرعة في تسهيل نقل البيانات إلى السحابة لتحليلها بدلاً من تخزينها داخلياً.
  • يسمح التخزين السحابي لرواد الأعمال بإجراء تحليلات جديدة للبيانات الضخمة في مجالات مثل التجارة الإلكترونية وأداء تطبيقات الويب.

📋 المحتوى المنظم

📖 محتوى تعليمي مفصّل

الجدول 1.6: خطوات اكتشاف المعرفة

نوع: محتوى تعليمي

الجدول 1.6: خطوات اكتشاف المعرفة

البيانات الضخمة والتخزين السحابي Big Data and Cloud Storage

نوع: محتوى تعليمي

البيانات الضخمة والتخزين السحابي Big Data and Cloud Storage

نوع: محتوى تعليمي

هناك خياران معتمدان لتخزين البيانات الضخمة: التخزين السحابي والتخزين الداخلي. ولقد كان تطوير تطبيقات البيانات الضخمة في الماضي يعتمد أساساً على حفظ البيانات في وسائط التخزين داخلياً (على الخوادم داخل الشركات والمؤسسات). مما تطلب توفير مستودعات بيانات محلية عالية التكلفة، وكذلك تثبيت برامج معقدة لإدارة تلك المستودعات. إلا أن التطورات الحديثة في علوم الحوسبة والبيانات أسهمت في استبدال تلك الطريقة بالتخزين السحابي، والذي يُعد بمثابة الحل الأمثل لتخزين البيانات الضخمة، وذلك لما يلي:

نوع: محتوى تعليمي

أ) توافر النطاق العريض عالي السرعة على نطاق واسع مما سهل حركة البيانات من مكان إلى آخر. ومع وجود بيانات منتجة محلياً لم تعد هناك حاجة لتخزين البيانات داخلياً، بل أصبح بالإمكان نقلها إلى التخزين السحابي لتحليلها.

نوع: محتوى تعليمي

ب) أصبحت غالبية التطبيقات تعتمد على التخزين السحابي، مما يعني أن عملية إنتاج المزيد من البيانات وتخزينها سحابياً تزداد باستمرار. ولقد ساهم ذلك في قيام أعداد متزايدة من رواد الأعمال بعمل تحليلات جديدة للبيانات الضخمة لمساعدة الشركات على تحليل البيانات السحابية في كثير من المجالات مثل: معاملات التجارة الإلكترونية وبيانات أداء تطبيقات الويب.

نوع: محتوى تعليمي

هناك جوانب متعددة للتخزين السحابي تجعله خياراً أفضل للشركات، فمثلاً يمكن أن يشمل التخزين السحابي أنظمة تخزين البيانات الضخمة وكذلك أنظمة النسخ الاحتياطي. وتوجد الكثير من الخيارات المتاحة من قبل مزودي الخدمات مثل أمازون (Amazon) ومايكروسوفت (Microsoft) وقوقل (Google) للتخزين السحابي مع توفيرها حماية البيانات والخصوصية، وبالطبع قابلية التوسع والتكلفة المعقولة لهذه الخدمات.

نوع: FIGURE_REFERENCE

شكل 1.7: مركز بيانات يوفر خدمة التخزين السحابي

نوع: METADATA

وزارة التعليم Ministry of Education 2023 - 1447

نوع: METADATA

24

🔍 عناصر مرئية

خطوات اكتشاف المعرفة

مركز بيانات يوفر خدمة التخزين السحابي

An image showing a large server room with multiple rows of server racks, illuminated by blue and white lights. The racks are filled with electronic equipment, suggesting a data center infrastructure. The perspective is from a slightly elevated angle, looking down the aisle between two rows of servers, extending into the distance. The image illustrates the physical infrastructure behind cloud storage services.

📄 النص الكامل للصفحة

--- SECTION: الجدول 1.6: خطوات اكتشاف المعرفة --- الجدول 1.6: خطوات اكتشاف المعرفة --- SECTION: البيانات الضخمة والتخزين السحابي Big Data and Cloud Storage --- البيانات الضخمة والتخزين السحابي Big Data and Cloud Storage هناك خياران معتمدان لتخزين البيانات الضخمة: التخزين السحابي والتخزين الداخلي. ولقد كان تطوير تطبيقات البيانات الضخمة في الماضي يعتمد أساساً على حفظ البيانات في وسائط التخزين داخلياً (على الخوادم داخل الشركات والمؤسسات). مما تطلب توفير مستودعات بيانات محلية عالية التكلفة، وكذلك تثبيت برامج معقدة لإدارة تلك المستودعات. إلا أن التطورات الحديثة في علوم الحوسبة والبيانات أسهمت في استبدال تلك الطريقة بالتخزين السحابي، والذي يُعد بمثابة الحل الأمثل لتخزين البيانات الضخمة، وذلك لما يلي: أ) توافر النطاق العريض عالي السرعة على نطاق واسع مما سهل حركة البيانات من مكان إلى آخر. ومع وجود بيانات منتجة محلياً لم تعد هناك حاجة لتخزين البيانات داخلياً، بل أصبح بالإمكان نقلها إلى التخزين السحابي لتحليلها. ب) أصبحت غالبية التطبيقات تعتمد على التخزين السحابي، مما يعني أن عملية إنتاج المزيد من البيانات وتخزينها سحابياً تزداد باستمرار. ولقد ساهم ذلك في قيام أعداد متزايدة من رواد الأعمال بعمل تحليلات جديدة للبيانات الضخمة لمساعدة الشركات على تحليل البيانات السحابية في كثير من المجالات مثل: معاملات التجارة الإلكترونية وبيانات أداء تطبيقات الويب. هناك جوانب متعددة للتخزين السحابي تجعله خياراً أفضل للشركات، فمثلاً يمكن أن يشمل التخزين السحابي أنظمة تخزين البيانات الضخمة وكذلك أنظمة النسخ الاحتياطي. وتوجد الكثير من الخيارات المتاحة من قبل مزودي الخدمات مثل أمازون (Amazon) ومايكروسوفت (Microsoft) وقوقل (Google) للتخزين السحابي مع توفيرها حماية البيانات والخصوصية، وبالطبع قابلية التوسع والتكلفة المعقولة لهذه الخدمات. شكل 1.7: مركز بيانات يوفر خدمة التخزين السحابي وزارة التعليم Ministry of Education 2023 - 1447 24 --- VISUAL CONTEXT --- **TABLE**: خطوات اكتشاف المعرفة Description: No description Table Structure: Headers: الخطوة | الوصف Rows: Row 1: تصحيح البيانات: | تنظيف البيانات التالفة وغير المطابقة، وإزالة أنواع البيانات الخاطئة وما إلى ذلك. Row 2: تكامل البيانات: | تضمين البيانات من مصادر متعددة، ويجب دمج مصادر البيانات هذه في مجموعة بيانات واحدة. Row 3: اختيار البيانات: | تحديد جزء مجموعة البيانات الذي يجب استخدامه لعملية استخراج البيانات، ومن المهم تحديد مجموعة البيانات الأكثر ملاءمة لأهدافك؛ لأن استخراج البيانات مهمة تستغرق وقتاً طويلاً. Row 4: تحويل صيغة البيانات: | يعد إعداد مجموعات البيانات الأولية وتنسيقها أمراً ضرورياً؛ لأن عمليات التنقيب عن البيانات تحتاج إلى أن يكون لمدخلاتها تنسيق محدد لتحليلها. Row 5: التنقيب في البيانات: | هي العملية الفعلية لتحليل البيانات واستخراج النتائج المرجوة من التحليل من خلال الأنماط. Row 6: تقييم النمط: | تقييم الأنماط التي تم إنشاؤها خلال خطوات التنقيب عن البيانات، وتحديد أيها مفيد لكل هدف محدد. Row 7: تمثيل المعرفة: | تمثيل النتائج التي تم الحصول عليها من خلال التقارير، والرسوم البيانية، والمخططات الواضحة والمختصرة. Context: Describes the sequential steps involved in the process of knowledge discovery from data, including data preparation, mining, evaluation, and representation. **FIGURE**: مركز بيانات يوفر خدمة التخزين السحابي Description: An image showing a large server room with multiple rows of server racks, illuminated by blue and white lights. The racks are filled with electronic equipment, suggesting a data center infrastructure. The perspective is from a slightly elevated angle, looking down the aisle between two rows of servers, extending into the distance. The image illustrates the physical infrastructure behind cloud storage services. Context: Visually represents a data center, which is the physical infrastructure that provides cloud storage services, as discussed in the accompanying text about Big Data and Cloud Storage.

🎴 بطاقات تعليمية للمراجعة

عدد البطاقات: 5 بطاقة لهذه الصفحة

ما هي الخطوة الأولى في عملية اكتشاف المعرفة من البيانات؟

  • أ) اختيار البيانات
  • ب) تقييم النمط
  • ج) تصحيح البيانات
  • د) تحويل صيغة البيانات

الإجابة الصحيحة: c

الإجابة: تصحيح البيانات

الشرح: تتضمن عملية اكتشاف المعرفة خطوات متسلسلة تبدأ بإعداد البيانات. الخطوة الأولى هي تصحيح البيانات، والتي تشمل تنظيف البيانات التالفة وغير المطابقة وإزالة أنواع البيانات الخاطئة لضمان جودة المدخلات للتحليل.

تلميح: هي الخطوة التي تتعامل مع جودة البيانات قبل التحليل.

التصنيف: خطوات | المستوى: سهل

ما هي الخطوة التي تلي 'تحويل صيغة البيانات' مباشرة في عملية اكتشاف المعرفة؟

  • أ) تقييم النمط
  • ب) التنقيب في البيانات
  • ج) تمثيل المعرفة
  • د) تكامل البيانات

الإجابة الصحيحة: b

الإجابة: التنقيب في البيانات

الشرح: بعد إعداد البيانات وتنسيقها في خطوة 'تحويل صيغة البيانات'، تأتي الخطوة الأساسية وهي 'التنقيب في البيانات'. هذه هي العملية الفعلية لتحليل البيانات واستخراج النتائج والأنماط المرجوة منها.

تلميح: هي العملية الفعلية لتحليل البيانات واستخراج الأنماط.

التصنيف: خطوات | المستوى: متوسط

ما الهدف الرئيسي من خطوة 'تمثيل المعرفة' في عملية اكتشاف المعرفة؟

  • أ) تحديد مجموعة البيانات الأكثر ملاءمة للأهداف.
  • ب) تقييم الأنماط التي تم إنشاؤها وتحديد أيها مفيد.
  • ج) تمثيل النتائج التي تم الحصول عليها من خلال التقارير والرسوم البيانية والمخططات الواضحة والمختصرة.
  • د) تضمين البيانات من مصادر متعددة ودمجها في مجموعة بيانات واحدة.

الإجابة الصحيحة: c

الإجابة: تمثيل النتائج التي تم الحصول عليها من خلال التقارير والرسوم البيانية والمخططات الواضحة والمختصرة.

الشرح: بعد استخراج الأنماط وتقييمها، تأتي الخطوة النهائية وهي 'تمثيل المعرفة'. هدفها الرئيسي هو تقديم النتائج التي تم التوصل إليها بشكل واضح وموجز، باستخدام أدوات مثل التقارير والرسوم البيانية والمخططات، لتسهيل فهمها واتخاذ القرارات بناءً عليها.

تلميح: تركز هذه الخطوة على عرض مخرجات التحليل بشكل مفهوم.

التصنيف: مفهوم جوهري | المستوى: سهل

ما أحد الأسباب الرئيسية التي تجعل التخزين السحابي الحل الأمثل للبيانات الضخمة؟

  • أ) توفير مستودعات بيانات محلية عالية التكلفة.
  • ب) اعتماد التطبيقات على التخزين الداخلي فقط.
  • ج) توافر النطاق العريض عالي السرعة على نطاق واسع مما سهل حركة البيانات.
  • د) الحاجة إلى تثبيت برامج معقدة لإدارة المستودعات.

الإجابة الصحيحة: c

الإجابة: توافر النطاق العريض عالي السرعة على نطاق واسع مما سهل حركة البيانات.

الشرح: أحد الأسباب الرئيسية لتفضيل التخزين السحابي للبيانات الضخمة هو توفر النطاق العريض عالي السرعة على نطاق واسع. هذا التطور في البنية التحتية للاتصالات سهّل نقل البيانات من مكان إنتاجها إلى مراكز التخزين السحابي، مما قلل الاعتماد على التخزين الداخلي المكلف.

تلميح: يتعلق السبب ببنية الاتصالات الحديثة وتسهيل نقل البيانات.

التصنيف: مفهوم جوهري | المستوى: متوسط

ما الفرق الرئيسي بين التخزين السحابي والتخزين الداخلي التقليدي للبيانات الضخمة من حيث قابلية التوسع؟

  • أ) التخزين الداخلي أكثر قابلية للتوسع وأقل تكلفة من السحابي.
  • ب) التخزين السحابي يوفر حماية أقل للبيانات ولكنه أرخص.
  • ج) يتميز التخزين السحابي بقابلية التوسع والتكلفة المعقولة مقارنة بالتخزين الداخلي الذي يتطلب استثمارات كبيرة.
  • د) كلاهما يوفر نفس مستوى قابلية التوسع ولكن بآليات مختلفة.

الإجابة الصحيحة: c

الإجابة: يتميز التخزين السحابي بقابلية التوسع والتكلفة المعقولة مقارنة بالتخزين الداخلي الذي يتطلب استثمارات كبيرة.

الشرح: الفرق الرئيسي يكمن في المرونة والتكلفة. التخزين الداخلي يتطلب استثمارات رأسمالية كبيرة في أجهزة وبرامج معقدة، مما يجعل التوسع صعباً ومكلفاً. بينما يوفر التخزين السحابي قابلية توسع مرنة، حيث يمكن زيادة السعة حسب الحاجة مع تكلفة تشغيلية معقولة، مما يجعله أكثر ملاءمة للبيانات الضخمة المتزايدة.

تلميح: فكر في المرونة المالية والتقنية عند زيادة حجم البيانات.

التصنيف: فرق بين مفهومين | المستوى: صعب