📚 النمذجة التنبؤية (استكمال)
المفاهيم الأساسية
التوقع (Forecasting): هو إجراء وتقديم تقديرات رقمية معينة بناءً على تحليل البيانات السابقة (البيانات التاريخية).
التجميع (Clustering): يُصنف البيانات إلى مجموعات بناءً على الخصائص المتشابهة بينها، ثم يستخدم بيانات كل مجموعة لتحديد النتائج على نطاق واسع لكل مجموعة.
اكتشاف القيم الشاذة (Outlier Detection): فحص وتحديد القيم الغريبة وغير العادية في البيانات، وتقييم مدى ارتباطها بفئات أو أرقام أخرى. والقيم الشاذة هي قيم البيانات غير المتجانسة أو المنفصلة عن بقية البيانات.
السلاسل الزمنية (Time Series): استخدام قيم البيانات المتوفرة سابقًا ضمن تسلسل زمني محدد كعوامل للإدخال؛ وذلك من أجل التنبؤ بقيم جديدة أو أحداث مستقبلية.
خريطة المفاهيم
```markmap
4. نمذجة البيانات التنبؤية والتوقع
النمذجة التنبؤية
فئات النمذجة التنبؤية
#### النماذج المعاملية (Parametric Models)
##### الافتراضات
###### جزء أساسي من النموذج
###### تحسن التنبؤات وتجعل النموذج أسهل للفهم
##### المبدأ
###### يضع افتراضات محددة حول شكل دالة التعيين
###### يفترض مجموعة محددة مسبقاً من المعاملات
###### يقوم بتلخيص بيانات التدريب من خلال هذه المعاملات
#### النماذج غير المعاملية (Non-Parametric Models)
##### المبدأ
###### لا تهتم بتكوين افتراضات حول دالة التعيين
###### يمكنها تقدير طبيعة العلاقة الوظيفية من خلال بيانات التدريب
###### خيار ممتاز لتحليل الكميات الكبيرة من البيانات دون معرفة سابقة
مصادر البيانات للتحليل
#### بيانات عملياتية (Transactional Data)
#### بيانات العملاء (Customer Data)
#### البيانات الطبية (Medical Data)
#### البيانات المالية (Financial Data)
#### المعلومات الديموغرافية (Demographic Data)
#### البيانات الجغرافية (Geographic Data)
#### بيانات التسويق الرقمي (Digital Marketing Data)
#### إحصائيات الويب (Web Traffic Statistics)
مهام النمذجة التنبؤية
#### 1. التصنيف (Classification)
##### المبدأ
###### تقييم المتغيرات المدخلة وتصنيفها في مجموعات
###### المخرجات ذات قيم متقطعة (Discrete)
##### الاستخدام
###### تقييم عمليات التمويل والبيع بالتجزئة
###### جمع المعلومات بسرعة وتصنيفها لتقديم إجابات
#### 2. الانحدار (Regression)
##### المبدأ
###### إيجاد علاقة رياضية تربط بين متغيرين
###### المتغير المستقل (Independent Variable) والمتغير التابع (Dependent Variable)
###### التنبؤ بقيم المتغير التابع من خلال معالجة قيم المتغير المستقل
###### التمثيل البياني: خط مستقيم (انحدار خطي)
##### الاستخدام
###### التنبؤ بقيم مستمرة (مثل: مدة بقاء شخص في المستشفى)
#### 3. التوقع (Forecasting)
##### المبدأ
###### تقدير قيم رقمية بناءً على تحليل البيانات التاريخية
##### الاستخدام
###### التنبؤ بأسعار الأسهم (يومي أو طويل الأجل)
#### 4. التجميع (Clustering)
##### المبدأ
###### تصنيف البيانات إلى مجموعات بناءً على خصائص متشابهة
##### طرق التجميع
###### التجميع الصلب (Hard Clustering)
####### تصنيف البيانات إلى مجموعات متميزة
####### تنتمي كل نقطة بيانات إلى مجموعة واحدة فقط
###### التجميع الناعم (Soft Clustering)
####### تعيين احتمالات لكل نقطة بيانات
####### يمكن أن تنتمي نقاط البيانات إلى أكثر من مجموعة
##### الاستخدام
###### تحديد استراتيجيات التسويق لفئات معينة من المستهلكين
#### 5. نموذج اكتشاف القيم الشاذة (Outlier Detection)
##### المبدأ
###### فحص وتحديد القيم الغريبة وغير العادية في البيانات
##### الاستخدام
###### تقييم مدى ارتباط القيم الشاذة بفئات أو أرقام أخرى
#### 6. السلاسل الزمنية (Time Series)
##### المبدأ
###### استخدام قيم البيانات السابقة في تسلسل زمني للتنبؤ بقيم مستقبلية
##### الاستخدام
###### تقديم توقعات مستقبلية لاتجاهات أو أحداث
###### تحليل تأثير العوامل الخارجية (الموسمية، العارضة)
###### مثال: تحليل وقت معالجة الطلبيات والتنبؤ بالمتوسط الشهري
طرائق أخرى للنمذجة التنبؤية
#### أشجار القرار (Decision Trees)
#### التعزيز الاشتقاقي (Gradient Boosting)
#### النماذج الخطية العامة (General Linear Models)
#### الشبكات العصبية (Neural Networks)
#### نماذج بروفيت (Prophet Models)
```
نقاط مهمة
- التوقع هو أحد أكثر نماذج التنبؤ شيوعًا وله استخدامات واسعة.
- التجميع له نوعان رئيسيان: الصلب (مجموعات متميزة) والناعم (احتمالات للانتماء).
- السلاسل الزمنية يمكنها تحليل تأثير العوامل الموسمية وغير المتوقعة على التوقعات المستقبلية.
- هناك طرائق أخرى متقدمة للنمذجة التنبؤية تستخدم في المسائل الأكثر تعقيدًا.