صفحة 148 - كتاب علم البيانات - الصف 11 - الفصل 1 - المملكة العربية السعودية

الكتاب: كتاب علم البيانات - الصف 11 - الفصل 1 | المادة: علم البيانات | المرحلة: الصف 11 | الفصل الدراسي: 1

الدولة: المملكة العربية السعودية | المنهج: المنهج السعودي - وزارة التعليم

📚 معلومات الصفحة

الكتاب: كتاب علم البيانات - الصف 11 - الفصل 1 | المادة: علم البيانات | المرحلة: الصف 11 | الفصل الدراسي: 1

الدولة: المملكة العربية السعودية | المنهج: المنهج السعودي - وزارة التعليم

نوع المحتوى: درس تعليمي

📝 ملخص الصفحة

📚 النمذجة التنبؤية (استكمال)

المفاهيم الأساسية

التوقع (Forecasting): هو إجراء وتقديم تقديرات رقمية معينة بناءً على تحليل البيانات السابقة (البيانات التاريخية).

التجميع (Clustering): يُصنف البيانات إلى مجموعات بناءً على الخصائص المتشابهة بينها، ثم يستخدم بيانات كل مجموعة لتحديد النتائج على نطاق واسع لكل مجموعة.

اكتشاف القيم الشاذة (Outlier Detection): فحص وتحديد القيم الغريبة وغير العادية في البيانات، وتقييم مدى ارتباطها بفئات أو أرقام أخرى. والقيم الشاذة هي قيم البيانات غير المتجانسة أو المنفصلة عن بقية البيانات.

السلاسل الزمنية (Time Series): استخدام قيم البيانات المتوفرة سابقًا ضمن تسلسل زمني محدد كعوامل للإدخال؛ وذلك من أجل التنبؤ بقيم جديدة أو أحداث مستقبلية.

خريطة المفاهيم

```markmap

4. نمذجة البيانات التنبؤية والتوقع

النمذجة التنبؤية

فئات النمذجة التنبؤية

#### النماذج المعاملية (Parametric Models)

##### الافتراضات

###### جزء أساسي من النموذج

###### تحسن التنبؤات وتجعل النموذج أسهل للفهم

##### المبدأ

###### يضع افتراضات محددة حول شكل دالة التعيين

###### يفترض مجموعة محددة مسبقاً من المعاملات

###### يقوم بتلخيص بيانات التدريب من خلال هذه المعاملات

#### النماذج غير المعاملية (Non-Parametric Models)

##### المبدأ

###### لا تهتم بتكوين افتراضات حول دالة التعيين

###### يمكنها تقدير طبيعة العلاقة الوظيفية من خلال بيانات التدريب

###### خيار ممتاز لتحليل الكميات الكبيرة من البيانات دون معرفة سابقة

مصادر البيانات للتحليل

#### بيانات عملياتية (Transactional Data)

#### بيانات العملاء (Customer Data)

#### البيانات الطبية (Medical Data)

#### البيانات المالية (Financial Data)

#### المعلومات الديموغرافية (Demographic Data)

#### البيانات الجغرافية (Geographic Data)

#### بيانات التسويق الرقمي (Digital Marketing Data)

#### إحصائيات الويب (Web Traffic Statistics)

مهام النمذجة التنبؤية

#### 1. التصنيف (Classification)

##### المبدأ

###### تقييم المتغيرات المدخلة وتصنيفها في مجموعات

###### المخرجات ذات قيم متقطعة (Discrete)

##### الاستخدام

###### تقييم عمليات التمويل والبيع بالتجزئة

###### جمع المعلومات بسرعة وتصنيفها لتقديم إجابات

#### 2. الانحدار (Regression)

##### المبدأ

###### إيجاد علاقة رياضية تربط بين متغيرين

###### المتغير المستقل (Independent Variable) والمتغير التابع (Dependent Variable)

###### التنبؤ بقيم المتغير التابع من خلال معالجة قيم المتغير المستقل

###### التمثيل البياني: خط مستقيم (انحدار خطي)

##### الاستخدام

###### التنبؤ بقيم مستمرة (مثل: مدة بقاء شخص في المستشفى)

#### 3. التوقع (Forecasting)

##### المبدأ

###### تقدير قيم رقمية بناءً على تحليل البيانات التاريخية

##### الاستخدام

###### التنبؤ بأسعار الأسهم (يومي أو طويل الأجل)

#### 4. التجميع (Clustering)

##### المبدأ

###### تصنيف البيانات إلى مجموعات بناءً على خصائص متشابهة

##### طرق التجميع

###### التجميع الصلب (Hard Clustering)

####### تصنيف البيانات إلى مجموعات متميزة

####### تنتمي كل نقطة بيانات إلى مجموعة واحدة فقط

###### التجميع الناعم (Soft Clustering)

####### تعيين احتمالات لكل نقطة بيانات

####### يمكن أن تنتمي نقاط البيانات إلى أكثر من مجموعة

##### الاستخدام

###### تحديد استراتيجيات التسويق لفئات معينة من المستهلكين

#### 5. نموذج اكتشاف القيم الشاذة (Outlier Detection)

##### المبدأ

###### فحص وتحديد القيم الغريبة وغير العادية في البيانات

##### الاستخدام

###### تقييم مدى ارتباط القيم الشاذة بفئات أو أرقام أخرى

#### 6. السلاسل الزمنية (Time Series)

##### المبدأ

###### استخدام قيم البيانات السابقة في تسلسل زمني للتنبؤ بقيم مستقبلية

##### الاستخدام

###### تقديم توقعات مستقبلية لاتجاهات أو أحداث

###### تحليل تأثير العوامل الخارجية (الموسمية، العارضة)

###### مثال: تحليل وقت معالجة الطلبيات والتنبؤ بالمتوسط الشهري

طرائق أخرى للنمذجة التنبؤية

#### أشجار القرار (Decision Trees)

#### التعزيز الاشتقاقي (Gradient Boosting)

#### النماذج الخطية العامة (General Linear Models)

#### الشبكات العصبية (Neural Networks)

#### نماذج بروفيت (Prophet Models)

```

نقاط مهمة

  • التوقع هو أحد أكثر نماذج التنبؤ شيوعًا وله استخدامات واسعة.
  • التجميع له نوعان رئيسيان: الصلب (مجموعات متميزة) والناعم (احتمالات للانتماء).
  • السلاسل الزمنية يمكنها تحليل تأثير العوامل الموسمية وغير المتوقعة على التوقعات المستقبلية.
  • هناك طرائق أخرى متقدمة للنمذجة التنبؤية تستخدم في المسائل الأكثر تعقيدًا.

📋 المحتوى المنظم

📖 محتوى تعليمي مفصّل

نوع: محتوى تعليمي

من المهام الشائعة الأخرى للنمذجة التنبؤية

نوع: محتوى تعليمي

3. التوقع Forecasting

نوع: محتوى تعليمي

هو إجراء وتقديم تقديرات رقمية معينة بناءً على تحليل البيانات السابقة والتي يطلق عليها البيانات التاريخية. وتستخدم شركات الاستثمار التوقعات للتنبؤ بأسعار الأسهم في التداولات اليومية أو طويلة الأجل. ويُعد نموذج التوقع من أكثر نماذج التنبؤ شيوعًا حيث يتميز بإمكانيات استخدام كبيرة في العديد من المجالات.

نوع: محتوى تعليمي

4. التجميع Clustering

نوع: محتوى تعليمي

يُصنف نموذج التجميع البيانات إلى مجموعات بناءً على الخصائص المتشابهة بينها، ثم يستخدم بيانات كل مجموعة (Cluster) لتحديد النتائج على نطاق واسع لكل مجموعة. وهناك نوعان من طرائق التجميع يتم استخدامهما في هذا النموذج: التجميع الصلب (Hard Clustering) يعتمد على تصنيف البيانات إلى مجموعات متميزة، حيث يمكن أن تنتمي كل نقطة بيانات إلى مجموعة واحدة فقط. والتجميع الناعم (Soft Clustering) يعتمد على تعيين احتمالات لكل نقطة بيانات، حيث يمكن أن تنتمي نقاط البيانات إلى أكثر من مجموعة واحدة. ويمكن للشركات استخدام نموذج التجميع لتحديد استراتيجيات التسويق لفئات معينة من المستهلكين.

نوع: FIGURE_REFERENCE

شكل 4.3: مثال على التجميع لأربع مجموعات بناء على قيمتي الدخل ومعدل الإنفاق

نوع: محتوى تعليمي

5. نموذج اكتشاف القيم الشاذة Outlier Detection

نوع: محتوى تعليمي

يطلق مصطلح الشاذة على قيم البيانات غير المتجانسة أو تلك المنفصلة عن بقية البيانات في مجموعة البيانات. ويمكن لنماذج اكتشاف القيم الشاذة فحص وتحديد القيم الغريبة وغير العادية في البيانات، وتقييم مدى ارتباطها بفئات أو أرقام أخرى.

نوع: محتوى تعليمي

6. السلاسل الزمنية Time Series

نوع: محتوى تعليمي

تستخدم نماذج السلاسل الزمنية قيم البيانات المتوفرة سابقًا ضمن تسلسل زمني محدد كعوامل للإدخال في مجموعة البيانات؛ وذلك من أجل التنبؤ بقيم جديدة أو أحداث مستقبلية. ويمكن لهذه النماذج تقديم التوقعات المستقبلية لاتجاهات أو أحداث فريدة أو متعددة. يمكن لنماذج السلاسل الزمنية أيضًا تحليل تأثير العوامل الخارجية كذلك الموسمية والعارضة (غير المتوقعة) التي قد تحدث على القيم والاتجاهات المستقبلية. على سبيل المثال يمكن لشركة صناعات إلكترونية استخدام نموذج السلاسل الزمنية لتحليل الوقت المطلوب لمعالجة الطلبيات على مدار العام الماضي، وبالتالي يمكن للنموذج التنبؤ بمتوسط وقت المعالجة الشهري.

نوع: محتوى تعليمي

تستخدم طرائق أخرى للنمذجة التنبؤية في المسائل الأكثر تعقيدًا.

نوع: محتوى تعليمي

من طرائق النمذجة التنبؤية:

نوع: محتوى تعليمي

أشجار القرار (Decision Trees). التعزيز الاشتقاقي (Gradient Boosting). النماذج الخطية العامة (General Linear Models). الشبكات العصبية (Neural Networks). نماذج بروفيت (Prophet Models).

🔍 عناصر مرئية

مثال على التجميع لأربع مجموعات بناء على قيمتي الدخل ومعدل الإنفاق

📄 النص الكامل للصفحة

من المهام الشائعة الأخرى للنمذجة التنبؤية 3. التوقع Forecasting هو إجراء وتقديم تقديرات رقمية معينة بناءً على تحليل البيانات السابقة والتي يطلق عليها البيانات التاريخية. وتستخدم شركات الاستثمار التوقعات للتنبؤ بأسعار الأسهم في التداولات اليومية أو طويلة الأجل. ويُعد نموذج التوقع من أكثر نماذج التنبؤ شيوعًا حيث يتميز بإمكانيات استخدام كبيرة في العديد من المجالات. 4. التجميع Clustering يُصنف نموذج التجميع البيانات إلى مجموعات بناءً على الخصائص المتشابهة بينها، ثم يستخدم بيانات كل مجموعة (Cluster) لتحديد النتائج على نطاق واسع لكل مجموعة. وهناك نوعان من طرائق التجميع يتم استخدامهما في هذا النموذج: التجميع الصلب (Hard Clustering) يعتمد على تصنيف البيانات إلى مجموعات متميزة، حيث يمكن أن تنتمي كل نقطة بيانات إلى مجموعة واحدة فقط. والتجميع الناعم (Soft Clustering) يعتمد على تعيين احتمالات لكل نقطة بيانات، حيث يمكن أن تنتمي نقاط البيانات إلى أكثر من مجموعة واحدة. ويمكن للشركات استخدام نموذج التجميع لتحديد استراتيجيات التسويق لفئات معينة من المستهلكين. شكل 4.3: مثال على التجميع لأربع مجموعات بناء على قيمتي الدخل ومعدل الإنفاق 5. نموذج اكتشاف القيم الشاذة Outlier Detection يطلق مصطلح الشاذة على قيم البيانات غير المتجانسة أو تلك المنفصلة عن بقية البيانات في مجموعة البيانات. ويمكن لنماذج اكتشاف القيم الشاذة فحص وتحديد القيم الغريبة وغير العادية في البيانات، وتقييم مدى ارتباطها بفئات أو أرقام أخرى. 6. السلاسل الزمنية Time Series تستخدم نماذج السلاسل الزمنية قيم البيانات المتوفرة سابقًا ضمن تسلسل زمني محدد كعوامل للإدخال في مجموعة البيانات؛ وذلك من أجل التنبؤ بقيم جديدة أو أحداث مستقبلية. ويمكن لهذه النماذج تقديم التوقعات المستقبلية لاتجاهات أو أحداث فريدة أو متعددة. يمكن لنماذج السلاسل الزمنية أيضًا تحليل تأثير العوامل الخارجية كذلك الموسمية والعارضة (غير المتوقعة) التي قد تحدث على القيم والاتجاهات المستقبلية. على سبيل المثال يمكن لشركة صناعات إلكترونية استخدام نموذج السلاسل الزمنية لتحليل الوقت المطلوب لمعالجة الطلبيات على مدار العام الماضي، وبالتالي يمكن للنموذج التنبؤ بمتوسط وقت المعالجة الشهري. تستخدم طرائق أخرى للنمذجة التنبؤية في المسائل الأكثر تعقيدًا. من طرائق النمذجة التنبؤية: أشجار القرار (Decision Trees). التعزيز الاشتقاقي (Gradient Boosting). النماذج الخطية العامة (General Linear Models). الشبكات العصبية (Neural Networks). نماذج بروفيت (Prophet Models). --- VISUAL CONTEXT --- **GRAPH**: مثال على التجميع لأربع مجموعات بناء على قيمتي الدخل ومعدل الإنفاق Description: No description X-axis: spend_score Y-axis: income Data: The scatter plot displays individual data points, each representing a combination of 'spend_score' and 'income'. The points are visually segregated into four main clusters, suggesting different customer segments based on these two metrics. The clusters are located in the bottom-left, mid-left, mid-right, and top-right quadrants of the graph, indicating different combinations of spend_score and income levels. Context: This graph serves as a visual example for the concept of 'Clustering' (التجميع) in data analysis, demonstrating how data points can be naturally grouped based on their features (income and spend score). (Note: Some details are estimated)

🎴 بطاقات تعليمية للمراجعة

عدد البطاقات: 5 بطاقة لهذه الصفحة

ما هو تعريف التوقع (Forecasting) في النمذجة التنبؤية؟

  • أ) هو تصنيف البيانات إلى مجموعات بناءً على الخصائص المتشابهة بينها.
  • ب) هو إجراء وتقديم تقديرات رقمية معينة بناءً على تحليل البيانات السابقة (البيانات التاريخية).
  • ج) هو فحص وتحديد القيم الغريبة وغير العادية في البيانات.
  • د) هو استخدام قيم البيانات المتوفرة سابقًا ضمن تسلسل زمني محدد للتنبؤ.

الإجابة الصحيحة: b

الإجابة: هو إجراء وتقديم تقديرات رقمية معينة بناءً على تحليل البيانات السابقة (البيانات التاريخية).

الشرح: 1. التوقع هو أحد نماذج النمذجة التنبؤية. 2. يعتمد على تحليل البيانات السابقة (التاريخية). 3. هدفه تقديم تقديرات رقمية للمستقبل. 4. يستخدم في مجالات مثل التنبؤ بأسعار الأسهم.

تلميح: يرتبط هذا النموذج بالتنبؤ باستخدام بيانات الماضي.

التصنيف: تعريف | المستوى: سهل

ما الفرق الرئيسي بين التجميع الصلب (Hard Clustering) والتجميع الناعم (Soft Clustering)؟

  • أ) التجميع الصلب يستخدم للبيانات الرقمية فقط، بينما الناعم للبيانات النصية.
  • ب) التجميع الصلب يعتمد على احتمالات، بينما الناعم يعتمد على تصنيف متميز.
  • ج) في التجميع الصلب تنتمي كل نقطة بيانات إلى مجموعة واحدة فقط، بينما في التجميع الناعم يمكن أن تنتمي نقاط البيانات إلى أكثر من مجموعة واحدة.
  • د) التجميع الصلب يستخدم في التسويق، بينما الناعم يستخدم في التمويل.

الإجابة الصحيحة: c

الإجابة: في التجميع الصلب تنتمي كل نقطة بيانات إلى مجموعة واحدة فقط، بينما في التجميع الناعم يمكن أن تنتمي نقاط البيانات إلى أكثر من مجموعة واحدة.

الشرح: 1. التجميع الصلب: يعتمد على تصنيف البيانات إلى مجموعات متميزة. 2. في هذا النوع، تنتمي كل نقطة بيانات إلى مجموعة واحدة فقط. 3. التجميع الناعم: يعتمد على تعيين احتمالات لكل نقطة بيانات. 4. في هذا النوع، يمكن أن تنتمي نقاط البيانات إلى أكثر من مجموعة واحدة.

تلميح: فكر في مدى انتماء نقطة البيانات إلى المجموعات.

التصنيف: فرق بين مفهومين | المستوى: متوسط

ما هو الهدف الرئيسي لنموذج اكتشاف القيم الشاذة (Outlier Detection)؟

  • أ) تصنيف البيانات إلى مجموعات بناءً على التشابه.
  • ب) تقديم تقديرات رقمية بناءً على البيانات التاريخية.
  • ج) فحص وتحديد القيم الغريبة وغير العادية في البيانات، وتقييم مدى ارتباطها بفئات أو أرقام أخرى.
  • د) تحليل تأثير العوامل الموسمية على الاتجاهات المستقبلية.

الإجابة الصحيحة: c

الإجابة: فحص وتحديد القيم الغريبة وغير العادية في البيانات، وتقييم مدى ارتباطها بفئات أو أرقام أخرى.

الشرح: 1. نموذج اكتشاف القيم الشاذة يبحث عن قيم غير متجانسة أو منفصلة عن بقية البيانات. 2. يقوم بفحص وتحديد هذه القيم الغريبة. 3. يهدف إلى تقييم مدى ارتباط هذه القيم الشاذة ببقية البيانات أو الفئات الأخرى.

تلميح: يركز هذا النموذج على البيانات التي تختلف عن النمط العام.

التصنيف: تعريف | المستوى: سهل

كيف تعمل نماذج السلاسل الزمنية (Time Series) في التنبؤ؟

  • أ) تصنف البيانات إلى مجموعات بناءً على وقت جمعها.
  • ب) تفحص القيم الشاذة في تسلسل زمني معين.
  • ج) تستخدم قيم البيانات المتوفرة سابقًا ضمن تسلسل زمني محدد كعوامل للإدخال؛ وذلك من أجل التنبؤ بقيم جديدة أو أحداث مستقبلية.
  • د) تعتمد على تحليل البيانات التاريخية دون اعتبار للترتيب الزمني.

الإجابة الصحيحة: c

الإجابة: تستخدم قيم البيانات المتوفرة سابقًا ضمن تسلسل زمني محدد كعوامل للإدخال؛ وذلك من أجل التنبؤ بقيم جديدة أو أحداث مستقبلية.

الشرح: 1. نماذج السلاسل الزمنية تستخدم البيانات السابقة. 2. هذه البيانات مرتبة ضمن تسلسل زمني محدد. 3. تستخدم هذه القيم كمدخلات للنموذج. 4. الهدف هو التنبؤ بقيم أو أحداث مستقبلية بناءً على هذا التسلسل.

تلميح: هذا النموذج يعتمد بشكل أساسي على عامل الزمن والتسلسل.

التصنيف: مفهوم جوهري | المستوى: متوسط

أي مما يلي يُعد مثالاً على تطبيق نموذج التجميع (Clustering) في الأعمال؟

  • أ) التنبؤ بأسعار الأسهم في التداولات اليومية.
  • ب) تحديد استراتيجيات التسويق لفئات معينة من المستهلكين.
  • ج) تحليل الوقت المطلوب لمعالجة الطلبيات في العام الماضي.
  • د) فحص القيم غير العادية في بيانات المبيعات.

الإجابة الصحيحة: b

الإجابة: تحديد استراتيجيات التسويق لفئات معينة من المستهلكين.

الشرح: 1. نموذج التجميع يصنف البيانات إلى مجموعات بناءً على التشابه. 2. في مجال الأعمال، يمكن تطبيقه على بيانات العملاء. 3. من خلال تجميع العملاء ذوي الخصائص المتشابهة (مثل الدخل ومعدل الإنفاق)، يمكن للشركة تصميم استراتيجيات تسويقية مخصصة لكل مجموعة (شريحة) من المستهلكين.

تلميح: التجميع يساعد في تقسيم العملاء إلى شرائح.

التصنيف: تفكير ناقد | المستوى: متوسط