صفحة 149 - كتاب علم البيانات - الصف 11 - الفصل 1 - المملكة العربية السعودية

الكتاب: كتاب علم البيانات - الصف 11 - الفصل 1 | المادة: علم البيانات | المرحلة: الصف 11 | الفصل الدراسي: 1

الدولة: المملكة العربية السعودية | المنهج: المنهج السعودي - وزارة التعليم

📚 معلومات الصفحة

الكتاب: كتاب علم البيانات - الصف 11 - الفصل 1 | المادة: علم البيانات | المرحلة: الصف 11 | الفصل الدراسي: 1

الدولة: المملكة العربية السعودية | المنهج: المنهج السعودي - وزارة التعليم

نوع المحتوى: درس تعليمي

📝 ملخص الصفحة

📚 عملية النمذجة التنبؤية

المفاهيم الأساسية

النمذجة التنبؤية: عملية تنفيذ خوارزميات على مجموعات من البيانات لإنشاء التنبؤات، تشمل إنشاء نموذج وتدريبه والتحقق من صحته وإدخال التحسينات عليه.

خريطة المفاهيم

```markmap

4. نمذجة البيانات التنبؤية والتوقع

النمذجة التنبؤية

فئات النمذجة التنبؤية

#### النماذج المعاملية (Parametric Models)

##### الافتراضات

###### جزء أساسي من النموذج

###### تحسن التنبؤات وتجعل النموذج أسهل للفهم

##### المبدأ

###### يضع افتراضات محددة حول شكل دالة التعيين

###### يفترض مجموعة محددة مسبقاً من المعاملات

###### يقوم بتلخيص بيانات التدريب من خلال هذه المعاملات

#### النماذج غير المعاملية (Non-Parametric Models)

##### المبدأ

###### لا تهتم بتكوين افتراضات حول دالة التعيين

###### يمكنها تقدير طبيعة العلاقة الوظيفية من خلال بيانات التدريب

###### خيار ممتاز لتحليل الكميات الكبيرة من البيانات دون معرفة سابقة

مصادر البيانات للتحليل

#### بيانات عملياتية (Transactional Data)

#### بيانات العملاء (Customer Data)

#### البيانات الطبية (Medical Data)

#### البيانات المالية (Financial Data)

#### المعلومات الديموغرافية (Demographic Data)

#### البيانات الجغرافية (Geographic Data)

#### بيانات التسويق الرقمي (Digital Marketing Data)

#### إحصائيات الويب (Web Traffic Statistics)

مهام النمذجة التنبؤية

#### 1. التصنيف (Classification)

##### المبدأ

###### تقييم المتغيرات المدخلة وتصنيفها في مجموعات

###### المخرجات ذات قيم متقطعة (Discrete)

##### الاستخدام

###### تقييم عمليات التمويل والبيع بالتجزئة

###### جمع المعلومات بسرعة وتصنيفها لتقديم إجابات

#### 2. الانحدار (Regression)

##### المبدأ

###### إيجاد علاقة رياضية تربط بين متغيرين

###### المتغير المستقل (Independent Variable) والمتغير التابع (Dependent Variable)

###### التنبؤ بقيم المتغير التابع من خلال معالجة قيم المتغير المستقل

###### التمثيل البياني: خط مستقيم (انحدار خطي)

##### الاستخدام

###### التنبؤ بقيم مستمرة (مثل: مدة بقاء شخص في المستشفى)

#### 3. التوقع (Forecasting)

##### المبدأ

###### تقدير قيم رقمية بناءً على تحليل البيانات التاريخية

##### الاستخدام

###### التنبؤ بأسعار الأسهم (يومي أو طويل الأجل)

#### 4. التجميع (Clustering)

##### المبدأ

###### تصنيف البيانات إلى مجموعات بناءً على خصائص متشابهة

##### طرق التجميع

###### التجميع الصلب (Hard Clustering)

####### تصنيف البيانات إلى مجموعات متميزة

####### تنتمي كل نقطة بيانات إلى مجموعة واحدة فقط

###### التجميع الناعم (Soft Clustering)

####### تعيين احتمالات لكل نقطة بيانات

####### يمكن أن تنتمي نقاط البيانات إلى أكثر من مجموعة

##### الاستخدام

###### تحديد استراتيجيات التسويق لفئات معينة من المستهلكين

#### 5. نموذج اكتشاف القيم الشاذة (Outlier Detection)

##### المبدأ

###### فحص وتحديد القيم الغريبة وغير العادية في البيانات

##### الاستخدام

###### تقييم مدى ارتباط القيم الشاذة بفئات أو أرقام أخرى

#### 6. السلاسل الزمنية (Time Series)

##### المبدأ

###### استخدام قيم البيانات السابقة في تسلسل زمني للتنبؤ بقيم مستقبلية

##### الاستخدام

###### تقديم توقعات مستقبلية لاتجاهات أو أحداث

###### تحليل تأثير العوامل الخارجية (الموسمية، العارضة)

###### مثال: تحليل وقت معالجة الطلبيات والتنبؤ بالمتوسط الشهري

طرائق أخرى للنمذجة التنبؤية

#### أشجار القرار (Decision Trees)

#### التعزيز الاشتقاقي (Gradient Boosting)

#### النماذج الخطية العامة (General Linear Models)

#### الشبكات العصبية (Neural Networks)

#### نماذج بروفيت (Prophet Models)

الخطوات الأساسية للنمذجة التنبؤية

#### 1. جمع البيانات وتنظيفها (Data Collection and Cleaning)

##### الهدف

###### استخراج المعلومات اللازمة من جميع المصادر المتوفرة

##### العملية

###### تنظيف البيانات من الشوائب والقيم الشاذة للحصول على تقديرات دقيقة

##### أمثلة على البيانات

###### عمليات البيع والشراء

###### استبانات العملاء

###### البيانات الإحصائية الاقتصادية والسكانية

###### البيانات المجمعة آلياً عبر الويب والأجهزة

#### 2. تحويل البيانات (Data Transformation)

##### الهدف

###### الحصول على البيانات في صورتها النهائية

##### العملية

###### توحيد بنية البيانات وصياغتها

###### تحديد نطاقات معينة لقيم البيانات

###### إزالة القيم الغريبة والبيانات الشاذة باستخدام تحليل الارتباط (Correlation Analysis)

#### 3. صياغة النموذج التنبؤي (Predictive Model Formulation)

##### العملية

###### تحديد طرائق التنبؤ المناسبة حسب الحاجة

###### تحديد بيانات التدريب والاختبار

##### أمثلة على الطرائق

###### استخدام شجرة القرار (Decision Tree) في عملية التصنيف

###### استخدام نموذج التعزيز الاشتقاقي (Gradient Boosting) في مهام الانحدار

##### التدريب والاختبار

###### تدريب الخوارزمية باستخدام بيانات التدريب

###### تطبيق النموذج الناتج على بيانات الاختبار لتحديد أدائه

#### 4. الاستنتاجات أو الاستدلالات (Inferences or Conclusions)

##### الهدف

###### استخراج الاستدلالات واستخلاص الاستنتاجات من النموذج

##### الفائدة

###### المساعدة في الإجابة على أسئلة الأعمال

```

نقاط مهمة

  • عملية النمذجة التنبؤية هي سلسلة من الخطوات المنظمة تبدأ بجمع البيانات وتنتهي باستخلاص استنتاجات مفيدة.
  • تنظيف البيانات وتحويلها خطوة حاسمة لضمان دقة النموذج التنبؤي.
  • اختيار الخوارزمية المناسبة (مثل شجرة القرار للتصنيف أو التعزيز الاشتقاقي للانحدار) يعتمد على طبيعة المهمة التنبؤية.
  • يتم تقييم أداء النموذج من خلال تطبيقه على مجموعة بيانات اختبار منفصلة.

📄 النص الكامل للصفحة

The Predictive Modeling Process يمكن تعريف النمذجة التنبؤية ببساطة على أنها عملية تنفيذ خوارزميات على مجموعات من البيانات لإنشاء التنبؤات، ويتم في هذه العملية إنشاء نموذج وتدريبه ، ثم التحقق من صحته وإدخال التحسينات عليه عند الحاجة، للحصول على المعلومات المناسبة التي تلبي احتياجات المؤسسة. وتتكون الخطوات الأساسية لإجراء النمذجة التنبؤية بشكل نموذجي من: --- SECTION: جمع البيانات وتنظيفها --- Data Collection and Cleaning إن من المهم القيام بجمع البيانات من جميع المصادر المتوفرة بهدف استخراج المعلومات اللازمة لعملية النمذجة، وبعد ذلك تجري عملية تنظيفها من الشوائب والقيم الشاذة للحصول على تقديرات دقيقة. وتُطبق هذه الخطوة على البيانات المختلفة مثل عمليات البيع والشراء والاستبانات الخاصة بالعملاء، والبيانات الإحصائية الخاصة بالاقتصاد والمسح السكاني، والبيانات التي يتم جمعها بشكل آلي عبر الويب ومن خلال الأجهزة المختلفة وغير ذلك. --- SECTION: تحويل البيانات --- Data Transformation تجري عملية تحويل البيانات بتوحيد بنية البيانات وصياغتها باستخدام عمليات معالجة دقيقة للحصول على البيانات في صورتها النهائية، وتشمل هذه العملية تحديد نطاقات معينة لقيم البيانات وإزالة القيم الغريبة والبيانات الشاذة من خلال تحليل الارتباط .(Correlation Analysis) --- SECTION: صياغة النموذج التنبؤي --- Formulation of the Predictive Model تتضمن عملية صياغة النموذج التنبؤي القيام بتحديد طرائق التنبؤ المناسبة حسب الحاجة ، فيمكن مثلا استخدام شجرة القرار في عملية التصنيف، بينما يجب استخدام نموذج التعزيز الاشتقاقي حين تكون المهمة تتعلق بالانحدار. ويجري أثناء هذه العملية تحديد بيانات التدريب والاختبار في النموذج، حيث يتم تدريب خوارزمية الإجراء المحدد باستخدام بيانات التدريب المتاحة ، ثم يتم تطبيق النموذج الناتج على البيانات لاختبارها وتحديد أداء النموذج. --- SECTION: الاستنتاجات أو الاستدلالات --- Inferences or Conclusions في النهاية يتم استخراج الاستدلالات واستخلاص الاستنتاجات من النموذج، والتي تساعد في الإجابة على أسئلة الأعمال. --- SECTION: شكل 4.4 --- مخطط عملية النمذجة التنبؤية --- VISUAL CONTEXT --- **DIAGRAM**: مخطط عملية النمذجة التنبؤية Description: A diagram illustrating the steps of the predictive modeling process. The diagram shows a person standing in front of a laptop, with arrows connecting different stages: جمع البيانات وتنظيفها (Data Collection and Cleaning), تحويل البيانات (Data Transformation), صياغة النموذج التنبؤي (Predictive Model Formulation), and الاستنتاجات أو الاستدلالات (Inferences or Conclusions).

🎴 بطاقات تعليمية للمراجعة

عدد البطاقات: 4 بطاقة لهذه الصفحة

ما هو التعريف الأساسي للنمذجة التنبؤية؟

  • أ) عملية جمع البيانات من مصادر مختلفة فقط دون تحليلها.
  • ب) عملية تنفيذ خوارزميات على مجموعات من البيانات لإنشاء التنبؤات، تتضمن إنشاء نموذج وتدريبه ثم التحقق من صحته وتحسينه.
  • ج) مجرد رسم مخططات بيانية لعرض البيانات التاريخية.
  • د) كتابة تقارير عن نتائج الأعمال السابقة دون أي تنبؤات.

الإجابة الصحيحة: b

الإجابة: عملية تنفيذ خوارزميات على مجموعات من البيانات لإنشاء التنبؤات، تتضمن إنشاء نموذج وتدريبه ثم التحقق من صحته وتحسينه.

الشرح: النمذجة التنبؤية هي عملية منهجية تهدف إلى استخراج معلومات مفيدة من البيانات للتنبؤ باحتمالات أو نتائج مستقبلية. تبدأ بجمع البيانات وتنتهي باستخلاص استنتاجات تساعد في اتخاذ القرارات.

تلميح: تتعلق هذه العملية باستخدام البيانات والخوارزميات للتنبؤ بالمستقبل.

التصنيف: تعريف | المستوى: سهل

ما هي الخطوة الأولى في عملية النمذجة التنبؤية كما وردت في النص؟

  • أ) صياغة النموذج التنبؤي واختيار الخوارزمية المناسبة.
  • ب) تحويل البيانات وتوحيد بنيتها.
  • ج) جمع البيانات وتنظيفها من الشوائب والقيم الشاذة.
  • د) استخلاص الاستنتاجات النهائية وتقديم التوصيات.

الإجابة الصحيحة: c

الإجابة: جمع البيانات وتنظيفها من الشوائب والقيم الشاذة.

الشرح: تعد جودة البيانات المدخلة عاملاً حاسماً في دقة النموذج التنبؤي. لذلك، تبدأ العملية بجمع البيانات من جميع المصادر المتاحة ثم تنظيفها لإزالة الأخطاء والقيم غير الطبيعية (الشاذة) التي قد تشوه النتائج.

تلميح: هذه الخطوة تسبق أي تحليل أو بناء للنموذج، وتهدف إلى ضمان جودة البيانات المدخلة.

التصنيف: صيغة/خطوات | المستوى: سهل

ما الهدف الرئيسي من خطوة 'تحويل البيانات' في النمذجة التنبؤية؟

  • أ) تخزين البيانات في قواعد بيانات ضخمة فقط.
  • ب) توحيد بنية البيانات وصياغتها باستخدام عمليات معالجة دقيقة للحصول على البيانات في صورتها النهائية المناسبة للتحليل.
  • ج) تجاهل البيانات التي لا تتطابق مع توقعات الباحث.
  • د) نشر البيانات الأولية مباشرة دون أي معالجة.

الإجابة الصحيحة: b

الإجابة: توحيد بنية البيانات وصياغتها باستخدام عمليات معالجة دقيقة للحصول على البيانات في صورتها النهائية المناسبة للتحليل.

الشرح: تحويل البيانات هو عملية تحضيرية حاسمة تلي التنظيف. تشمل عمليات مثل توحيد التنسيق، وتحديد النطاقات المقبولة للقيم، وإزالة البيانات الشاذة باستخدام تحليل الارتباط، مما يضمن أن البيانات في شكل يمكن للنموذج معالجته بكفاءة.

تلميح: تهدف هذه الخطوة إلى جعل البيانات جاهزة ومتجانسة للاستخدام في بناء النموذج.

التصنيف: مفهوم جوهري | المستوى: متوسط

في خطوة 'صياغة النموذج التنبؤي'، كيف يتم تقييم أداء النموذج؟

  • أ) بمقارنة نتائج النموذج مع آراء الخبراء فقط.
  • ب) يتم تدريب الخوارزمية على بيانات التدريب، ثم تطبيق النموذج الناتج على بيانات الاختبار لقياس أدائه.
  • ج) عن طريق نشر النموذج مباشرة للاستخدام العملي دون اختبار.
  • د) باستخدام نفس بيانات التدريب لتقييم الأداء مرة أخرى.

الإجابة الصحيحة: b

الإجابة: يتم تدريب الخوارزمية على بيانات التدريب، ثم تطبيق النموذج الناتج على بيانات الاختبار لقياس أدائه.

الشرح: لضمان أن النموذج يعمل بشكل جيد على بيانات جديدة (وليس فقط البيانات التي تدرب عليها)، نقسم البيانات إلى مجموعتين: مجموعة تدريب لبناء النموذج، ومجموعة اختبار لتقييم دقته وفعاليته. هذا يساعد في اكتشاف مشكلة 'التجهيز الزائد' (Overfitting).

تلميح: تتضمن هذه الخطوة تقسيم البيانات إلى مجموعتين لأغراض مختلفة.

التصنيف: صيغة/خطوات | المستوى: متوسط