📝 ملخص الصفحة
📚 التحليل الاستكشافي للبيانات: الأنماط والأدوات
المفاهيم الأساسية
التحليل غير الرسومي أحادي المتغير: تحليل يقيس تأثير متغير واحد فقط دون استخدام تقنيات التصوير البياني (مثال: تأثير العمر على الإصابة بمرض الزهايمر).
التحليل غير الرسومي متعدد المتغيرات: تحليل يأخذ في الاعتبار آثار عدة متغيرات معًا دون استخدام تقنيات التصوير البياني (مثال: إضافة آثار النظام الغذائي والتمارين الذهنية والوراثة إلى مثال العمر).
التحليل الرسومي أحادي المتغير: تحليل متغير واحد فقط وعرضه بطريقة رسومية (مثال: مخطط شريطي يوضح نسبة السكر في خمسة أنواع من الحلوى).
التحليل الرسومي متعدد المتغيرات: تحليل عدة متغيرات معًا وتصوير علاقة الارتباط بينها بشكل بياني (مثال: مخطط نقطي يوضح العلاقة بين سعر الحلوى ومحتواها من السكر، مع ترميز النقاط بالألوان بناءً على احتوائها على الشوكولاتة).
خريطة المفاهيم
```markmap
فحص وتحليل البيانات
تصنيف أنماط تحليل البيانات
التحليل التنبؤي (Predictive)
#### الهدف
- التنبؤ بالنتائج المستقبلية
#### الأساس
- الاتجاهات المكتشفة سابقاً
- البيانات التاريخية
#### الأدوات
#### أمثلة تطبيقية
- التنبؤ بالطقس
- سياسات التأمين
التحليل التوجيهي (Prescriptive)
#### الهدف
- إيجاد مسار العمل الأمثل
- تقديم توصيات مستقبلية
#### الأساس
- اكتشافات مراحل التحليل السابقة
#### مجال مفيد
- القطاع الصحي (لتوصيات طبية آمنة)
عملية تحليل البيانات
الخطوات
- إعداد البيانات وتنظيفها
- التحليل الاستكشافي للبيانات
- تصوير البيانات
دورة حياة علم البيانات (الشكل 3.2)
- تحديد المشكلة وصياغتها
- جمع البيانات
- إعداد وتنظيف البيانات
- التحليل الاستكشافي للبيانات
#### الأهداف
- اكتشاف الاتجاهات والأنماط والميزات الجديدة
- اكتشاف الحالات الشاذة
- اختيار الفرضيات الأولية
- فهم متغيرات البيانات والعلاقات بينها
- تحديد الأخطاء الواضحة
- التأكد من صحة النواتج
#### الأنماط
##### غير رسومي
- أحادي المتغير
- متعدد المتغيرات
##### رسومي
- أحادي المتغير
- متعدد المتغيرات
- تصوير البيانات
#### أمثلة توضيحية
##### غير رسومي أحادي المتغير
- تأثير العمر على الإصابة بمرض الزهايمر
##### غير رسومي متعدد المتغيرات
- إضافة آثار النظام الغذائي والتمارين الذهنية والوراثة
##### رسومي أحادي المتغير
- مخطط شريطي (Bar Chart) لمحتوى السكر في 5 أنواع من الحلوى (الشكل 3.4)
##### رسومي متعدد المتغيرات
- مخطط نقطي (Scatter Plot) للعلاقة بين سعر الحلوى ومحتواها من السكر، مع ترميز لوني لوجود الشوكولاتة (الشكل 3.5)
أدوات تحليل البيانات
برامج جداول البيانات
- إكسل (الأكثر شيوعاً واستخداماً)
لغات البرمجة والبيئات البرمجية
- مفكرة جوبيتر (Jupyter Notebook) ← الأداة المستخدمة في هذه الوحدة
- آر ستوديو (RStudio)
- ما تلاب (MATLAB)
```
نقاط مهمة
- التحليل غير الرسومي لا يستخدم تقنيات التصوير البياني، بينما التحليل الرسومي يستخدمها.
- المخطط الشريطي (Bar Chart) مثال على التحليل الرسومي أحادي المتغير.
- المخطط النقطي (Scatter Plot) مثال على التحليل الرسومي متعدد المتغيرات، حيث يمكنه عرض علاقة متغيرين (مثل السكر والسعر) وتمييز فئة ثالثة (مثل وجود الشوكولاتة) بالألوان.
- اختيار أداة تحليل البيانات يعتمد أولاً على فهم الاحتياجات.
- إكسل هي الأداة التحليلية الأكثر شيوعاً واستخداماً على نطاق واسع في جميع الصناعات تقريباً.
🎴 بطاقات تعليمية للمراجعة
عدد البطاقات: 5 بطاقة لهذه الصفحة
ما هو تعريف التحليل غير الرسومي أحادي المتغير؟
- أ) هو تحليل يستخدم الرسوم البيانية لدراسة متغير واحد.
- ب) هو تحليل يقيس تأثير متغير واحد فقط دون استخدام تقنيات التصوير البياني.
- ج) هو تحليل يقيس تأثير عدة متغيرات باستخدام الرسوم البيانية.
- د) هو تحليل يستخدم لتصنيف البيانات النوعية فقط.
الإجابة الصحيحة: b
الإجابة: هو تحليل يقيس تأثير متغير واحد فقط دون استخدام تقنيات التصوير البياني.
الشرح: 1. التحليل غير الرسومي أحادي المتغير يركز على متغير واحد مستقل. 2. لا يعتمد على الرسوم البيانية أو التمثيلات المرئية. 3. مثال: دراسة تأثير العمر على الإصابة بمرض الزهايمر.
تلميح: فكر في نوع التحليل الذي يركز على عامل واحد ويبتعد عن الرسوم البيانية.
التصنيف: تعريف | المستوى: سهل
ما الفرق الرئيسي بين التحليل غير الرسومي أحادي ومتعدد المتغيرات؟
- أ) الأحادي يستخدم الرسوم البيانية، والمتعدد لا يستخدمها.
- ب) الأحادي يركز على متغير واحد، والمتعدد يركز على عدة متغيرات معًا.
- ج) الأحادي يستخدم للبيانات الكمية فقط، والمتعدد للبيانات النوعية.
- د) لا يوجد فرق، كلاهما نفس النوع من التحليل.
الإجابة الصحيحة: b
الإجابة: الأحادي يركز على متغير واحد، والمتعدد يركز على عدة متغيرات معًا.
الشرح: 1. التحليل أحادي المتغير: يدرس تأثير أو سلوك متغير مستقل واحد فقط (مثل العمر). 2. التحليل متعدد المتغيرات: يدرس تأثير أو سلوك عدة متغيرات مستقلة معًا (مثل العمر والنظام الغذائي والوراثة).
تلميح: انظر إلى عدد العوامل أو المتغيرات التي يتم دراستها في كل نوع.
التصنيف: فرق بين مفهومين | المستوى: متوسط
ما هو المثال على التحليل الرسومي متعدد المتغيرات كما ورد في النص؟
- أ) مخطط شريطي (Bar Chart) يوضح نسبة السكر في خمسة أنواع من الحلوى.
- ب) جدول بيانات يوضح أسعار خمسة أنواع من الحلوى.
- ج) مخطط نقطي (Scatter Plot) يوضح علاقة السعر بمحتوى السكر في الحلوى، مع ترميز لوني لاحتواء الشوكولاتة.
- د) مخطط دائري (Pie Chart) يوضح توزيع أنواع الحلوى في السوق.
الإجابة الصحيحة: c
الإجابة: مخطط نقطي (Scatter Plot) يوضح علاقة السعر بمحتوى السكر في الحلوى، مع ترميز لوني لاحتواء الشوكولاتة.
الشرح: 1. التحليل الرسومي متعدد المتغيرات يعرض عدة متغيرات معًا بشكل بياني. 2. المثال في النص: مخطط نقطي يحلل ثلاث متغيرات: محتوى السكر (المحور السيني)، والسعر (المحور الصادي)، واحتواء الشوكولاتة (الترميز اللوني).
تلميح: فكر في رسم بياني يحلل أكثر من خاصية أو متغير في وقت واحد.
التصنيف: مفهوم جوهري | المستوى: متوسط
ما هي الأداة التحليلية الأكثر شيوعًا واستخدامًا على نطاق واسع في جميع الصناعات تقريبًا؟
- أ) مفكرة جوبيتر (Jupyter Notebook).
- ب) برنامج إكسل (Excel).
- ج) آر ستوديو (RStudio).
- د) ما تلاب (MATLAB).
الإجابة الصحيحة: b
الإجابة: برنامج إكسل (Excel).
الشرح: 1. النص يذكر أن هناك العديد من أدوات تحليل البيانات. 2. يحدد أن الأداة الأكثر شيوعًا واستخدامًا على نطاق واسع في جميع الصناعات تقريبًا هي إكسل.
تلميح: فكر في أداة تحليل البيانات التي تعتمد على جداول البيانات وتستخدم في معظم المكاتب.
التصنيف: مفهوم جوهري | المستوى: سهل
ما هي البيئات البرمجية الثلاثة الأكثر شعبية المذكورة لتحليل البيانات؟
- أ) إكسل، وبايثون، وجافا.
- ب) مفكرة جوبيتر (Jupyter Notebook)، وآر ستوديو (RStudio)، وما تلاب (MATLAB).
- ج) باور بي آي (Power BI)، وتابلو (Tableau)، وإكسل.
- د) جوجل كولاب (Google Colab)، وسبي إس إس (SPSS)، وساس (SAS).
الإجابة الصحيحة: b
الإجابة: مفكرة جوبيتر (Jupyter Notebook)، وآر ستوديو (RStudio)، وما تلاب (MATLAB).
الشرح: 1. بالإضافة إلى برامج جداول البيانات مثل إكسل، يمكن إجراء تحليل البيانات بلغات البرمجة والبيئات البرمجية. 2. البيئات الأكثر شعبية المذكورة هي: مفكرة جوبيتر، وآر ستوديو، وما تلاب.
تلميح: تذكر أن النص ذكر ثلاثة أسماء محددة بعد الحديث عن إكسل.
التصنيف: مفهوم جوهري | المستوى: متوسط