🎴 بطاقات تعليمية للمراجعة
عدد البطاقات: 3 بطاقة لهذه الصفحة
ما هي الوظيفة في مكتبة pandas التي تُستخدم لعرض الإحصائيات الوصفية الأساسية (مثل المتوسط، الانحراف المعياري، القيم الربعية) لأعمدة البيانات الرقمية في إطار البيانات؟
- أ) الوظيفة info()
- ب) الوظيفة head()
- ج) الوظيفة describe()
- د) الوظيفة columns
الإجابة الصحيحة: c
الإجابة: الوظيفة describe()
الشرح: 1. الوظيفة describe() هي إحدى الوظائف الأساسية في كائن إطار البيانات (DataFrame) في مكتبة pandas.
2. تُطبق هذه الوظيفة تلقائياً على الأعمدة التي تحتوي على بيانات رقمية.
3. تُرجع إحصائيات وصفية تشمل: عدد القيم (count)، المتوسط (mean)، الانحراف المعياري (std)، القيمة الدنيا (min)، القيم الربعية (25%، 50%، 75%)، والقيمة العظمى (max).
4. تُساعد في فهم توزيع البيانات واكتشاف القيم المتطرفة بسرعة.
تلميح: تُستخدم هذه الوظيفة للحصول على ملخص إحصائي سريع.
التصنيف: تعريف | المستوى: سهل
ما هو الغرض الأساسي من استخدام السمة (الخاصية) 'columns' لكائن إطار البيانات (DataFrame) في pandas؟
- أ) لحساب عدد الصفوف في الجدول.
- ب) لحذف عمود معين من الجدول.
- ج) لتصفية البيانات بناءً على شرط معين.
- د) للوصول إلى أسماء أعمدة الجدول أو طباعتها.
الإجابة الصحيحة: d
الإجابة: للوصول إلى أسماء أعمدة الجدول أو طباعتها.
الشرح: 1. السمة 'columns' هي خاصية (attribute) لكائن إطار البيانات (DataFrame) في مكتبة pandas.
2. عند الوصول إليها (مثل data.columns)، تُرجع كائن Index يحتوي على أسماء جميع الأعمدة في إطار البيانات.
3. يمكن استخدامها في حلقة تكرار (loop) لطباعة أو معالجة كل اسم عمود على حدة.
4. تُعد أداة أساسية لاستكشاف هيكل مجموعة البيانات وفهم المتغيرات المتاحة.
تلميح: هذه السمة تُرجع قائمة تحتوي على معلومات محددة عن هيكل البيانات.
التصنيف: مفهوم جوهري | المستوى: سهل
أي من الإحصائيات التالية تُرجعها وظيفة describe() في pandas؟
- أ) الوسيط (median) فقط والمنوال (mode).
- ب) المتوسط (mean)، الانحراف المعياري (std)، والقيمة العظمى (max).
- ج) مجموع القيم (sum) والتباين (variance).
- د) عدد القيم الفريدة (unique) ونسبة القيم المفقودة (null).
الإجابة الصحيحة: b
الإجابة: المتوسط (mean)، الانحراف المعياري (std)، والقيمة العظمى (max).
الشرح: 1. وظيفة describe() تُرجع مجموعة من الإحصائيات الوصفية الأساسية.
2. تشمل هذه الإحصائيات: عدد القيم (count)، والمتوسط الحسابي (mean)، ومقدار تشتت البيانات حول المتوسط (الانحراف المعياري std).
3. كما تشمل القيم الدنيا والعظمى (min, max) والقيم الربعية (25%، 50%، 75%) التي تُظهر توزيع البيانات.
4. في المثال المعطى، تظهر قيم mean و std و max بوضوح في الجدول الناتج عن data.describe().
تلميح: تتعلق هذه الإحصائيات بقياس النزعة المركزية والتشتت والقيم القصوى للبيانات.
التصنيف: مفهوم جوهري | المستوى: متوسط