خطوة 2: استخدم أداة التوقع Use a Forecasting Tool - كتاب علم البيانات - الصف 11 - الفصل 1 - المملكة العربية السعودية

الكتاب: كتاب علم البيانات - الصف 11 - الفصل 1 | المادة: علم البيانات | المرحلة: الصف 11 | الفصل الدراسي: 1

الدولة: المملكة العربية السعودية | المنهج: المنهج السعودي - وزارة التعليم

الدرس: خطوة 2: استخدم أداة التوقع Use a Forecasting Tool

📚 معلومات الصفحة

الكتاب: كتاب علم البيانات - الصف 11 - الفصل 1 | المادة: علم البيانات | المرحلة: الصف 11 | الفصل الدراسي: 1

الدولة: المملكة العربية السعودية | المنهج: المنهج السعودي - وزارة التعليم

نوع المحتوى: درس تعليمي

📝 ملخص الصفحة

📚 استخدام أداة التوقع وضبط السلاسل الزمنية

المفاهيم الأساسية

السلاسل الزمنية (Time series): هي مجموعة من البيانات الكمية، يتم جمعها لفترة زمنية متساوية، وتتمثل وصفًا لواحد أو أكثر من الصفات أو الخصائص المتعلقة بشخص أو ظاهرة أو حدث معين، والتي يتم جمعها خلال فترات زمنية متتابعة.

خريطة المفاهيم

```markmap

4. نمذجة البيانات التنبؤية والتوقع

النمذجة التنبؤية

خطوات البدء بإنشاء نموذج تنبؤي

التطبيقات العملية في واقعنا اليومي

تطبيقات النمذجة التنبؤية

#### المبيعات والأرباح

##### تحديد مكانة الشركة المالية

##### الكشف عن الأقسام ذات الأداء المنخفض (مثل قسم المبيعات)

##### تحسين أداء الشركة وإدخال التحسينات

#### التسويق

##### استهداف فئات معينة من العملاء بالحملات الترويجية

##### توقع استجابات العملاء ومتطلباتهم

##### معرفة رغبات العملاء والتنبؤ بالمنتجات المستقبلية

#### وسائل التواصل الاجتماعي

##### مصدر للبيانات الضخمة غير المنظمة

##### تحليل البيانات للتنبؤ بالاتجاهات المستقبلية

##### استكشاف اهتمامات العملاء لتطوير الخطط المستقبلية

#### تقييم المخاطر

##### تقييم المخاطر المتعلقة بتمويل الأفراد والأعمال

##### تقييم أهلية التمويل والكشف عن الاحتيال

##### تقييم مخاطر الاستثمار وتحديد العائد المستقبلي

#### تحسين الجودة

##### استخدام ملاحظات العملاء لتحسين جودة المنتج أو الخدمة

##### التنبؤ بالأثر المتوقع للتغييرات في المنتجات أو الخدمات

خصائص وتحديات النماذج التنبؤية

#### العلاقة بين الدقة والتعقيد

#### أسباب فشل النماذج

#### متطلبات نجاح النموذج

أنواع النماذج التنبؤية

#### نماذج القيم الشاذة

#### نماذج السلاسل الزمنية

التوقع (Forecasting)

الفرق بين التوقع والتنبؤ

#### التوقع: تقدير قيمة متغير في المستقبل بناءً على قيمه السابقة (مرتبط بالزمن).

#### التنبؤ: إنشاء نموذج لتخمين نتيجة بناءً على متغيرات حالية (قد لا يكون مرتبطاً بالزمن).

خطوات عملية التوقع

#### خطوة 1: تحديد البيانات المراد تحليلها والسعي للحصول عليها.

##### التطبيق: الحصول على البيانات

###### الهدف: توقع العدد الشهري للرحلات السياحية للعام 2023.

###### المصدر: منصة البيانات المفتوحة السعودية (https://open.data.gov.sa/).

###### البيانات المستخدمة: بيانات السياحة الشهرية للعام 2019 فقط.

###### السبب: استبعاد بيانات 2020 و2021 بسبب تأثيرات جائحة كورونا (COVID-19).

#### خطوة 2: استخدام أدوات برمجية لإعداد مجموعة البيانات.

##### الأداة: مايكروسوفت إكسل (Microsoft Excel).

###### خطوات إعداد البيانات في إكسل:

  • تحميل ملف البيانات من المصدر عبر زر "تحميل" (Download) ثم فتحه (Open File).
  • في ورقة العمل 11، نسخ محتويات الخلايا J59:J70 (أسماء الأشهر) ولصقها في الخلايا A2:A13 في ملف إكسل جديد.
  • كتابة "الشهر" في الخلية A1 وإضافة "2019" إلى اسم كل شهر.
  • في ورقة العمل 11 نفسها، نسخ محتويات الخلايا D59:D70 (عدد الرحلات) ولصقها في الخلايا B2:B13 في الملف الجديد.
  • كتابة "الرحلات السياحية" في الخلية B1.
#### خطوة 3: ضبط السلسلة الزمنية المناسبة للتوقع.

##### استخدام أداة التوقع

###### تصدير البيانات إلى أداة برمجية (مايكروسوفت إكسل).

###### هيكلة البيانات في عمودين: أسماء الأشهر، وبيانات أعداد الرحلات.

##### ضبط السلاسل الزمنية

###### المشكلة: أسماء الشهور نصية ولا يمكن استخدامها كسلسلة زمنية.

###### الحل: إنشاء عمود جديد يحتوي على أرقام تسلسلية (من 1 إلى 12) لتمثيل الشهور.

###### السبب: تتطلب السلسلة الزمنية فترات زمنية متسقة ممثلة بشكل رقمي أو تاريخي.

#### خطوة 4: إنشاء التوقعات.

#### خطوة 5: تمثيل البيانات رسومياً.

#### خطوة 6: تحليل النتائج.

تمارين تطبيقية

#### التنبؤ بحوادث المرور

##### تحديد البيانات المطلوبة من منصة البيانات المفتوحة

##### تحديد نوع البيانات وعدد السنوات

#### تصنيف الصور (وسائل المواصلات)

##### خطوات إنشاء النموذج من جمع البيانات حتى التدريب

#### المخاوف الأخلاقية والخصوصية

##### أمثلة على مخاوف الخصوصية في النمذجة التنبؤية

##### الجانب الأخلاقي لاستخدام النماذج في التوظيف والترقية بناءً على بيانات صحية

```

نقاط مهمة

  • بعد الحصول على البيانات، يتم تصديرها إلى أداة برمجية (مثل إكسل) لإنشاء التوقع.
  • يجب أن تحتوي السلسلة الزمنية على قيم رقمية أو تاريخية، وليست نصية، لتمثيل الفترات الزمنية بشكل متسق.
  • في مثال بيانات الرحلات السياحية لعام 2019، يتم استخدام عمود الأرقام التسلسلية (1-12) كسلسلة زمنية، وليس عمود أسماء الشهور النصية.
  • البيانات في الشكل 4.10 توضح هيكلة ورقة العمل: عمود للأرقام التسلسلية، وعمود لأسماء الشهور، وعمود لعدد الرحلات السياحية (بالآلاف).

📋 المحتوى المنظم

📖 محتوى تعليمي مفصّل

خطوة 2: استخدم أداة التوقع Use a Forecasting Tool

نوع: محتوى تعليمي

بعد الحصول على بيانات أعداد الرحلات السياحية الشهرية لعام 2019، يتعين عليك تصديرها إلى أداة برمجية للتوقع. ستستخدم مايكروسوفت إكسل لوجود عمود يحتوي على سلسلة زمنية جديدة تسمى "2019". سيحتوي العمود الأول على أسماء أشهر السنة الميلادية، والعمود الثاني على بيانات أعداد الرحلات السياحية لكل شهر من أشهر العام 2019.

خطوة 3: ضبط السلاسل الزمنية Set the Time Series

نوع: محتوى تعليمي

تتطلب عملية إنشاء التوقع في مايكروسوفت إكسل وجود عمود يحتوي على سلسلة زمنية بقيم رقمية (أرقام أو تواريخ). ولهذا السبب لا يمكنك استخدام العمود الذي يحتوي على أسماء الشهور كعمود لسلسلة زمنية وذلك لكون البيانات فيه نصية. وللتغلب على هذه المشكلة، ستنشئ عمودًا يمثل الشهور ويحتوي على الأرقام من 1 إلى 12 بشكل متسلسل كما هو موضح في الشكل 4.10.

السلاسل الزمنية (Time series):

نوع: محتوى تعليمي

هي مجموعة من البيانات الكمية، يتم جمعها لفترة زمنية متساوية، وتتمثل وصفًا لواحد أو أكثر من الصفات أو الخصائص المتعلقة بشخص أو ظاهرة أو حدث معين، والتي يتم جمعها خلال فترات زمنية متتابعة.

نوع: محتوى تعليمي

تتطلب السلسلة الزمنية فترات زمنية متسقة بين نقاط البيانات، سواء كانت تلك البيانات فترات زمنية أو تواريخ ممثلة على شكل رقمي. ستستخدم الأرقام التسلسلية الممثلة للشهور في العمود (A) للسلسلة الزمنية وليس العمود (B) الذي يحتوي على القيم النصية لأسماء الشهور.

نوع: FIGURE_REFERENCE

شكل 4.10: البيانات في ورقة عمل إكسل

🔍 عناصر مرئية

البيانات في ورقة عمل إكسل

An Excel worksheet displaying data for monthly tourist trips in 2019. The worksheet is structured with three columns: Column A contains sequential numbers from 1 to 12, representing the months. Column B contains the names of the months (يناير, فبراير, مارس, أبريل, مايو, يونيو, يوليو, أغسطس, سبتمبر, أكتوبر, نوفمبر, ديسمبر) for the year 2019. Column C contains numerical values representing the number of tourist trips, estimated in thousands. A callout indicates that Column A (sequential numbers) should be used for time series analysis, not Column B (month names), because time series require numerical or date-based consistent time intervals. Another callout specifies that the values in Column C represent 'عدد الرحلات السياحية الوافدة للمملكة العربية السعودية (مقدرًا بالآلاف)' (Number of incoming tourist trips to Saudi Arabia (estimated in thousands)). A third callout labels Column A as 'أرقام تسلسلية' (Sequential numbers) and Column B as 'يحتوي العمود B على أسماء الشهور في العام 2019' (Column B contains the names of the months in 2019).

📄 النص الكامل للصفحة

--- SECTION: خطوة 2: استخدم أداة التوقع Use a Forecasting Tool --- بعد الحصول على بيانات أعداد الرحلات السياحية الشهرية لعام 2019، يتعين عليك تصديرها إلى أداة برمجية للتوقع. ستستخدم مايكروسوفت إكسل لوجود عمود يحتوي على سلسلة زمنية جديدة تسمى "2019". سيحتوي العمود الأول على أسماء أشهر السنة الميلادية، والعمود الثاني على بيانات أعداد الرحلات السياحية لكل شهر من أشهر العام 2019. --- SECTION: خطوة 3: ضبط السلاسل الزمنية Set the Time Series --- تتطلب عملية إنشاء التوقع في مايكروسوفت إكسل وجود عمود يحتوي على سلسلة زمنية بقيم رقمية (أرقام أو تواريخ). ولهذا السبب لا يمكنك استخدام العمود الذي يحتوي على أسماء الشهور كعمود لسلسلة زمنية وذلك لكون البيانات فيه نصية. وللتغلب على هذه المشكلة، ستنشئ عمودًا يمثل الشهور ويحتوي على الأرقام من 1 إلى 12 بشكل متسلسل كما هو موضح في الشكل 4.10. --- SECTION: السلاسل الزمنية (Time series): --- هي مجموعة من البيانات الكمية، يتم جمعها لفترة زمنية متساوية، وتتمثل وصفًا لواحد أو أكثر من الصفات أو الخصائص المتعلقة بشخص أو ظاهرة أو حدث معين، والتي يتم جمعها خلال فترات زمنية متتابعة. تتطلب السلسلة الزمنية فترات زمنية متسقة بين نقاط البيانات، سواء كانت تلك البيانات فترات زمنية أو تواريخ ممثلة على شكل رقمي. ستستخدم الأرقام التسلسلية الممثلة للشهور في العمود (A) للسلسلة الزمنية وليس العمود (B) الذي يحتوي على القيم النصية لأسماء الشهور. شكل 4.10: البيانات في ورقة عمل إكسل --- VISUAL CONTEXT --- **FIGURE**: البيانات في ورقة عمل إكسل Description: An Excel worksheet displaying data for monthly tourist trips in 2019. The worksheet is structured with three columns: Column A contains sequential numbers from 1 to 12, representing the months. Column B contains the names of the months (يناير, فبراير, مارس, أبريل, مايو, يونيو, يوليو, أغسطس, سبتمبر, أكتوبر, نوفمبر, ديسمبر) for the year 2019. Column C contains numerical values representing the number of tourist trips, estimated in thousands. A callout indicates that Column A (sequential numbers) should be used for time series analysis, not Column B (month names), because time series require numerical or date-based consistent time intervals. Another callout specifies that the values in Column C represent 'عدد الرحلات السياحية الوافدة للمملكة العربية السعودية (مقدرًا بالآلاف)' (Number of incoming tourist trips to Saudi Arabia (estimated in thousands)). A third callout labels Column A as 'أرقام تسلسلية' (Sequential numbers) and Column B as 'يحتوي العمود B على أسماء الشهور في العام 2019' (Column B contains the names of the months in 2019). Table Structure: Headers: A | B | C Rows: Row 1: 1 | يناير 2019 | 1.653 Row 2: 2 | فبراير 2019 | 1.492 Row 3: 3 | مارس 2019 | 1.599 Row 4: 4 | أبريل 2019 | 1.650 Row 5: 5 | مايو 2019 | 2.079 Row 6: 6 | يونيو 2019 | 903 Row 7: 7 | يوليو 2019 | 750 Row 8: 8 | أغسطس 2019 | 2.675 Row 9: 9 | سبتمبر 2019 | 635 Row 10: 10 | أكتوبر 2019 | 1.119 Row 11: 11 | نوفمبر 2019 | 1.234 Row 12: 12 | ديسمبر 2019 | 1.735 Row 13: 13 | 2019 | EMPTY Empty cells: Cell C13 is empty. Cells A14, B14, C14 are empty. Calculation needed: The table provides raw data for time series analysis and forecasting. No explicit calculations are shown or requested within the table itself. X-axis: N/A Y-axis: N/A Data: The table shows monthly data for tourist trips. Column A provides numerical month indices (1-12). Column B lists the month names and year (2019). Column C contains the corresponding number of tourist trips in thousands. Key Values: Month indices 1-12, Months: يناير 2019 to ديسمبر 2019, Tourist trips (in thousands): 1.653, 1.492, 1.599, 1.650, 2.079, 903, 750, 2.675, 635, 1.119, 1.234, 1.735 Context: This figure serves as an example of how to prepare and structure data in an Excel worksheet for time series forecasting, emphasizing the importance of numerical time indicators over textual ones for proper analysis.

🎴 بطاقات تعليمية للمراجعة

عدد البطاقات: 3 بطاقة لهذه الصفحة

ما هو التعريف العلمي للسلاسل الزمنية (Time series)؟

  • أ) هي مجموعة من البيانات النوعية التي تصف اتجاهات السوق خلال فترة زمنية عشوائية.
  • ب) هي مجموعة من البيانات الكمية، يتم جمعها لفترة زمنية متساوية، وتتمثل وصفًا لواحد أو أكثر من الصفات أو الخصائص المتعلقة بشخص أو ظاهرة أو حدث معين، والتي يتم جمعها خلال فترات زمنية متتابعة.
  • ج) هي أداة برمجية في إكسل تستخدم فقط للتنبؤ بالمبيعات المستقبلية.
  • د) هي تمثيل بياني للبيانات يتم إنشاؤه دون اشتراط تساوي الفترات الزمنية بين النقاط.

الإجابة الصحيحة: b

الإجابة: هي مجموعة من البيانات الكمية، يتم جمعها لفترة زمنية متساوية، وتتمثل وصفًا لواحد أو أكثر من الصفات أو الخصائص المتعلقة بشخص أو ظاهرة أو حدث معين، والتي يتم جمعها خلال فترات زمنية متتابعة.

الشرح: 1. السلسلة الزمنية هي مجموعة من البيانات الكمية (أرقام). 2. يتم جمع هذه البيانات على فترات زمنية متساوية (مثل شهريًا). 3. الغرض منها هو وصف صفة أو خاصية لشيء ما (ظاهرة، حدث، شخص). 4. يتم جمعها بشكل متتابع عبر الزمن.

تلميح: فكر في نوع البيانات وطريقة جمعها والغرض منها.

التصنيف: تعريف | المستوى: سهل

ما الشرط الأساسي الذي يجب أن تتوفر فيه البيانات لاستخدامها كسلسلة زمنية في أداة توقع مثل إكسل؟

  • أ) يجب أن تكون البيانات نصية لوصف الفترات الزمنية بشكل واضح للمستخدم.
  • ب) يجب أن تكون البيانات رقمية (أرقام أو تواريخ) وتمثل فترات زمنية متسقة.
  • ج) يجب أن تحتوي البيانات على سنة محددة في كل صف، مثل 'يناير 2019'.
  • د) يجب أن تكون البيانات في عمود واحد فقط دون الحاجة إلى مؤشر زمني منفصل.

الإجابة الصحيحة: b

الإجابة: يجب أن تكون البيانات رقمية (أرقام أو تواريخ) وتمثل فترات زمنية متسقة.

الشرح: 1. تتطلب أدوات التوقع (مثل إكسل) أن تكون السلسلة الزمنية بقيم رقمية أو تاريخية. 2. البيانات النصية (مثل أسماء الشهور) لا يمكن استخدامها مباشرة. 3. يجب أن تكون الفترات الزمنية بين نقاط البيانات متسقة (مثل 1، 2، 3... لتمثيل الأشهر).

تلميح: لماذا لا يمكن استخدام أسماء الشهور مباشرة؟

التصنيف: مفهوم جوهري | المستوى: متوسط

ما الخطوة العملية المذكورة للتغلب على مشكلة كون أسماء الشهور بيانات نصية غير صالحة للسلسلة الزمنية في إكسل؟

  • أ) حذف عمود أسماء الشهور والاعتماد على التواريخ في رأس الصفحة فقط.
  • ب) تحويل أسماء الشهور إلى تواريخ باستخدام دالة DATE في إكسل.
  • ج) إنشاء عمود جديد يحتوي على أرقام تسلسلية (مثل من 1 إلى 12) لتمثيل الفترات الزمنية.
  • د) دمج عمود الشهور مع عمود البيانات الرقمية في خلية واحدة.

الإجابة الصحيحة: c

الإجابة: إنشاء عمود جديد يحتوي على أرقام تسلسلية (مثل من 1 إلى 12) لتمثيل الفترات الزمنية.

الشرح: 1. المشكلة: أسماء الشهور نصية ولا تقبلها أدوات التوقع كسلسلة زمنية. 2. الحل: إنشاء عمود جديد. 3. محتوى العمود: أرقام تسلسلية (1، 2، 3... 12). 4. الغرض: تمثيل الفترات الزمنية (الأشهر) بشكل رقمي متسق.

تلميح: كيف يمكن تحويل المعلومات النصية (الشهور) إلى صيغة مقبولة للتحليل؟

التصنيف: صيغة/خطوات | المستوى: متوسط