صفحة 117 - كتاب علم البيانات - الصف 11 - الفصل 1 - المملكة العربية السعودية

الكتاب: كتاب علم البيانات - الصف 11 - الفصل 1 | المادة: علم البيانات | المرحلة: الصف 11 | الفصل الدراسي: 1

الدولة: المملكة العربية السعودية | المنهج: المنهج السعودي - وزارة التعليم

📚 معلومات الصفحة

الكتاب: كتاب علم البيانات - الصف 11 - الفصل 1 | المادة: علم البيانات | المرحلة: الصف 11 | الفصل الدراسي: 1

الدولة: المملكة العربية السعودية | المنهج: المنهج السعودي - وزارة التعليم

نوع المحتوى: درس تعليمي

📝 ملخص الصفحة

📚 استكشاف البيانات باستخدام Pandas

المفاهيم الأساسية

وظيفة `describe()`: تُستخدم لعرض بعض التفاصيل الإحصائية الأساسية للبيانات الرقمية في إطار البيانات.

خريطة المفاهيم

```markmap

استكشاف البيانات

طباعة أسماء الأعمدة

الوصول إلى السمة `columns`

استخدام حلقة `for` للطباعة

الحصول على إحصائيات أساسية

استخدام `data.describe()`

الإحصائيات المعروضة

#### count (العدد)

#### mean (المتوسط)

#### std (الانحراف المعياري)

#### min (القيمة الدنيا)

#### 25%، 50%، 75% (الربيعيات)

#### max (القيمة القصوى)

```

نقاط مهمة

  • يمكن طباعة أسماء أعمدة إطار البيانات (`DataFrame`) باستخدام السمة `data.columns` داخل حلقة تكرار.
  • تُظهر نتيجة `data.describe()` إحصائيات موجزة لكل عمود رقمي، مثل عدد القيم والمتوسط والانحراف المعياري والقيم القصوى والدنيا.
  • مثال من الصفحة: إحصائيات لأعمدة "مجموع الطلبة"، "مجموع المعلمين"، و"مجموع الإداريين" لمجموعة بيانات تحتوي على 5597 صفاً.

📄 النص الكامل للصفحة

# Acessing the dataframe attribute 'columns' to print the names of # the table's columns for col in data.columns: print (col) المنطقة الإدارية المرحلة نوع المدرسة مجموع الطلبة مجموع المعلمين مجموع الإداريين طباعة أسماء أعمدة إطار البيانات. data.describe () تستخدم وظيفة describe() لعرض بعض التفاصيل الإحصائية الأساسية. الشكل 3.19 استخدام الفهرسة في كائن إطار البيانات وزارة التعليم Mistry of Education 2025-1447 --- VISUAL CONTEXT --- **TABLE**: Untitled Description: Table showing statistical details for مجموع الطلبة, مجموع المعلمين, and مجموع الإداريين Table Structure: Headers: مجموع الطلبة | مجموع المعلمين | مجموع الإداريين Rows: Row 1: 5597.000000 | 5597.000000 | 5597.000000 | count Row 2: 19.459175 | 89.510988 | 1110.124352 | mean Row 3: 66.800341 | 192.359535 | 2950.990275 | std Row 4: 0.000000 | 0.000000 | 0.000000 | min Row 5: 0.000000 | 4.000000 | 31.000000 | 25% Row 6: 1.000000 | 17.000000 | 136.000000 | 50% Row 7: 10.000000 | 82.000000 | 808.000000 | 75% Row 8: 1152.000000 | 2090.000000 | 36416.000000 | max Context: Shows statistical data for student, teacher, and administrative staff counts.

🎴 بطاقات تعليمية للمراجعة

عدد البطاقات: 3 بطاقة لهذه الصفحة

ما هي الوظيفة في مكتبة pandas التي تُستخدم لعرض الإحصائيات الوصفية الأساسية (مثل المتوسط، الانحراف المعياري، القيم الربعية) لأعمدة البيانات الرقمية في إطار البيانات؟

  • أ) الوظيفة info()
  • ب) الوظيفة head()
  • ج) الوظيفة describe()
  • د) الوظيفة columns

الإجابة الصحيحة: c

الإجابة: الوظيفة describe()

الشرح: 1. الوظيفة describe() هي إحدى الوظائف الأساسية في كائن إطار البيانات (DataFrame) في مكتبة pandas. 2. تُطبق هذه الوظيفة تلقائياً على الأعمدة التي تحتوي على بيانات رقمية. 3. تُرجع إحصائيات وصفية تشمل: عدد القيم (count)، المتوسط (mean)، الانحراف المعياري (std)، القيمة الدنيا (min)، القيم الربعية (25%، 50%، 75%)، والقيمة العظمى (max). 4. تُساعد في فهم توزيع البيانات واكتشاف القيم المتطرفة بسرعة.

تلميح: تُستخدم هذه الوظيفة للحصول على ملخص إحصائي سريع.

التصنيف: تعريف | المستوى: سهل

ما هو الغرض الأساسي من استخدام السمة (الخاصية) 'columns' لكائن إطار البيانات (DataFrame) في pandas؟

  • أ) لحساب عدد الصفوف في الجدول.
  • ب) لحذف عمود معين من الجدول.
  • ج) لتصفية البيانات بناءً على شرط معين.
  • د) للوصول إلى أسماء أعمدة الجدول أو طباعتها.

الإجابة الصحيحة: d

الإجابة: للوصول إلى أسماء أعمدة الجدول أو طباعتها.

الشرح: 1. السمة 'columns' هي خاصية (attribute) لكائن إطار البيانات (DataFrame) في مكتبة pandas. 2. عند الوصول إليها (مثل data.columns)، تُرجع كائن Index يحتوي على أسماء جميع الأعمدة في إطار البيانات. 3. يمكن استخدامها في حلقة تكرار (loop) لطباعة أو معالجة كل اسم عمود على حدة. 4. تُعد أداة أساسية لاستكشاف هيكل مجموعة البيانات وفهم المتغيرات المتاحة.

تلميح: هذه السمة تُرجع قائمة تحتوي على معلومات محددة عن هيكل البيانات.

التصنيف: مفهوم جوهري | المستوى: سهل

أي من الإحصائيات التالية تُرجعها وظيفة describe() في pandas؟

  • أ) الوسيط (median) فقط والمنوال (mode).
  • ب) المتوسط (mean)، الانحراف المعياري (std)، والقيمة العظمى (max).
  • ج) مجموع القيم (sum) والتباين (variance).
  • د) عدد القيم الفريدة (unique) ونسبة القيم المفقودة (null).

الإجابة الصحيحة: b

الإجابة: المتوسط (mean)، الانحراف المعياري (std)، والقيمة العظمى (max).

الشرح: 1. وظيفة describe() تُرجع مجموعة من الإحصائيات الوصفية الأساسية. 2. تشمل هذه الإحصائيات: عدد القيم (count)، والمتوسط الحسابي (mean)، ومقدار تشتت البيانات حول المتوسط (الانحراف المعياري std). 3. كما تشمل القيم الدنيا والعظمى (min, max) والقيم الربعية (25%، 50%، 75%) التي تُظهر توزيع البيانات. 4. في المثال المعطى، تظهر قيم mean و std و max بوضوح في الجدول الناتج عن data.describe().

تلميح: تتعلق هذه الإحصائيات بقياس النزعة المركزية والتشتت والقيم القصوى للبيانات.

التصنيف: مفهوم جوهري | المستوى: متوسط