📝 ملخص الصفحة
📚 تصفية البيانات (الفهرسة المنطقية)
المفاهيم الأساسية
تصفية البيانات (Data Filtering): عملية اختيار جزء أصغر من مجموعة البيانات واستخدام تلك المجموعة الجزئية للعرض أو التحليل.
الفهرسة المنطقية (Boolean Indexing): نوع من الفهرسة التي تستخدم القيم الفعلية لمجموعة البيانات، وتحتاج إلى استخدام المعاملات المنطقية.
خريطة المفاهيم
```markmap
استكشاف البيانات
تصفية البيانات (اختيار مجموعة جزئية)
تعريف: اختيار جزء أصغر من البيانات للعرض أو التحليل
طرق التصفية
#### الفهرسة المنطقية (Boolean Indexing)
##### الأسهل
##### تستخدم القيم الفعلية والمعاملات المنطقية
##### أمثلة على كائن المتسلسلة (Series)
###### s[s > 0]
###### s[(s<-1) | (s > 6)]
###### s[~(s<0)]
#### طرق loc و iloc
##### الأكثر قوة
طباعة أسماء الأعمدة
الوصول إلى السمة `columns`
استخدام حلقة `for` للطباعة
الحصول على إحصائيات أساسية
استخدام `data.describe()`
الإحصائيات المعروضة
#### count (العدد)
#### mean (المتوسط)
#### std (الانحراف المعياري)
#### min (القيمة الدنيا)
#### 25%، 50%، 75% (الربيعيات)
#### max (القيمة القصوى)
```
نقاط مهمة
- أحياناً لا تحتاج إلى مجموعة البيانات بأكملها، بل تحتاج إلى عزل بيانات محددة.
- المعاملات المنطقية تكتب بشكل مختلف في مفكرة جوبيتر مقارنة ببايثون.
- الجدول 3.9 يوضح الفرق بين المعاملات المنطقية في جوبيتر وبايثون:
-
جوبيتر `&` يقابل
بايثون `and`
- جوبيتر `|` يقابل بايثون `or`
- جوبيتر `~` يقابل بايثون `not`
🎴 بطاقات تعليمية للمراجعة
عدد البطاقات: 5 بطاقة لهذه الصفحة
ما هو تعريف عملية تصفية البيانات (Data Filtering)؟
- أ) هي عملية حذف البيانات غير الصحيحة من مجموعة البيانات بالكامل.
- ب) هي عملية اختيار جزء أصغر من مجموعة البيانات واستخدام تلك المجموعة الجزئية للعرض أو التحليل.
- ج) هي عملية تحويل البيانات من صيغة إلى أخرى لتسهيل قراءتها.
- د) هي عملية دمج مجموعات بيانات متعددة في مجموعة واحدة كبيرة.
الإجابة الصحيحة: b
الإجابة: هي عملية اختيار جزء أصغر من مجموعة البيانات واستخدام تلك المجموعة الجزئية للعرض أو التحليل.
الشرح: تصفية البيانات هي خطوة أساسية في معالجة البيانات تهدف إلى عزل البيانات المحددة المطلوبة للتحليل من مجموعة البيانات الكبيرة، مما يحسن كفاءة المعالجة ويركز على المعلومات ذات الصلة.
تلميح: تتعلق باختيار جزء محدد من البيانات الكلية.
التصنيف: تعريف | المستوى: سهل
ما هي الفهرسة المنطقية (Boolean Indexing)؟
- أ) هي طريقة لترتيب البيانات تصاعدياً أو تنازلياً بناءً على قيم عمود معين.
- ب) هي أسلوب لتعيين أسماء دلالية للأعمدة في إطار البيانات.
- ج) هي نوع من الفهرسة التي تستخدم القيم الفعلية لمجموعة البيانات، وتحتاج إلى استخدام المعاملات المنطقية.
- د) هي عملية تقسيم مجموعة البيانات إلى مجموعات تدريب واختبار.
الإجابة الصحيحة: c
الإجابة: هي نوع من الفهرسة التي تستخدم القيم الفعلية لمجموعة البيانات، وتحتاج إلى استخدام المعاملات المنطقية.
الشرح: الفهرسة المنطقية هي أسلوب لتصفية البيانات حيث يتم تحديد صفوف أو عناصر البيانات بناءً على تقييم شرط منطقي (مثل s > 0) لقيمها، مما ينتج عنه مجموعة فرعية من البيانات التي تحقق ذلك الشرط.
تلميح: تعتمد على تطبيق شروط منطقية على قيم البيانات نفسها.
التصنيف: تعريف | المستوى: متوسط
لاختيار العناصر في المتسلسلة 's' التي تحقق الشرط: أن تكون قيمتها أقل من -1 أو أكبر من 6، أي تعبير منطقي نستخدم داخل الأقواس المربعة؟
- أ) (s < -1) and (s > 6)
- ب) (s < -1) || (s > 6)
- ج) (s < -1) | (s > 6)
- د) (s < -1) & (s > 6)
الإجابة الصحيحة: c
الإجابة: (s < -1) | (s > 6)
الشرح: لجمع شرطين باستخدام 'أو' (OR) في الفهرسة المنطقية داخل جوبيتر نوت بوك، نضع كل شرط بين قوسين ونربطهما بعلامة '|' (التي تمثل OR في هذا السياق). لذا، التعبير الصحيح هو (s < -1) | (s > 6).
تلميح: تتطلب عملية 'أو' المنطقية استخدام المعامل المناسب في جوبيتر.
التصنيف: صيغة/خطوات | المستوى: صعب
عند استخدام الفهرسة المنطقية (Boolean Indexing) في مفكرة جوبيتر، ما الرمز المستخدم لتمثيل معامل "النفي" (NOT) وكيف يختلف عن نظيره في لغة بايثون القياسية؟
- أ) يُستخدم الرمز (!) في جوبيتر، بينما يُستخدم (inverse) في بايثون.
- ب) يُستخدم الرمز (&) في جوبيتر، بينما يُستخدم (and) في بايثون.
- ج) يُستخدم الرمز (|) في جوبيتر، بينما يُستخدم (or) في بايثون.
- د) يُستخدم الرمز (~) في جوبيتر، بينما يُستخدم (not) في بايثون.
الإجابة الصحيحة: d
الإجابة: يُستخدم الرمز (~) في جوبيتر، بينما يُستخدم (not) في بايثون.
الشرح: تشير الصفحة إلى أن المعاملات المنطقية تُكتب بشكل مختلف في مفكرة جوبيتر عن بايثون. وفقاً للجدول 3.9، فإن معامل النفي (NOT) يُكتب ككلمة (not) في بايثون، بينما يُستعاض عنه بالرمز (~) عند استخدامه في مفكرة جوبيتر للفهرسة المنطقية.
تلميح: لاحظ الجدول الذي يقارن بين الرموز والمعاملات النصية، وركز على الرمز الذي يعكس القيمة أو ينفيها.
التصنيف: فرق بين مفهومين | المستوى: متوسط
ما تعريف عملية تصفية البيانات (Data Filtering) في علم البيانات؟
- أ) هي عملية حذف البيانات المكررة من مجموعة البيانات.
- ب) هي عملية تحويل البيانات إلى تنسيق آخر لتحليلها.
- ج) هي عملية اختيار جزء أصغر من مجموعة البيانات واستخدام تلك المجموعة الجزئية للعرض أو التحليل.
- د) هي عملية تجميع البيانات حسب فئات محددة.
الإجابة الصحيحة: c
الإجابة: هي عملية اختيار جزء أصغر من مجموعة البيانات واستخدام تلك المجموعة الجزئية للعرض أو التحليل.
الشرح: تصفية البيانات هي تقنية لاستخراج جزء محدد من البيانات باستخدام شروط أو مرشحات (مثل الفهرسة المنطقية أو طرق loc و iloc)، وذلك للتركيز على تحليل بيانات معينة دون التعامل مع مجموعة البيانات الكاملة.
تلميح: فكر في الهدف من عزل بيانات محددة من مجموعة أكبر.
التصنيف: تعريف | المستوى: متوسط