صفحة 116 - كتاب علم البيانات - الصف 11 - الفصل 1 - المنهج السعودي - وزارة التعليم

📚 معلومات الصفحة

الكتاب: كتاب علم البيانات - الصف 11 - الفصل 1 | المادة: علم البيانات | المرحلة: الصف 11 | الفصل الدراسي: 1

الدولة: المملكة العربية السعودية | المنهج: المنهج السعودي - وزارة التعليم

نوع المحتوى: درس تعليمي

📝 ملخص الصفحة

📚 استخدام الفهرسة في كائن إطار البيانات

المفاهيم الأساسية

الفهرسة (Indexing): اختيار محدد للصفوف والأعمدة من إطار البيانات.

خريطة المفاهيم

```markmap

فحص وتحليل البيانات

أدوات تحليل البيانات

لغات البرمجة والبيانات البرمجية

#### بايثون (Python)

##### مفكرة جوبيتر (Jupyter Notebook)

###### فتح ملفات Excel في Jupyter

####### الشرط: أن يكون ملف Excel والمفكرة في نفس المجلد.

##### مكتبات البايثون

###### مكتبة بانداس (Pandas)

####### كائنات المكتبة الرئيسية

######## إطار البيانات (DataFrame Object)

######### إنشاء إطار بيانات من ملف Excel

########## الوظيفة: `pd.read_excel('filename.xlsx')`

########## قراءة ورقة عمل محددة: استخدام وسيط `sheet_name`

######### سمات كائن إطار البيانات (Attributes)

########## shape: ترجع أبعاد إطار البيانات (عدد الصفوف والأعمدة).

########## size: ترجع العدد الإجمالي للعناصر في إطار البيانات (n x m).

########## dtypes: ترجع نوع القيمة لكل عمود.

########## axes: ترجع عدد الصفوف وأسماء الأعمدة.

########## أنواع البيانات في Pandas مقابل Python

########### (انظر الجدول أدناه)

####### الفهرسة (Indexing)

######## تعريف: اختيار محدد للصفوف والأعمدة من إطار البيانات.

######## أنواع الاختيار:

######### جميع الصفوف وبعض الأعمدة.

######### بعض الصفوف وجميع الأعمدة.

######### بعض من كل صف وعمود.

######## وظائف الفهرسة في كائن المتسلسلة (Series):

######### head(): ترجع العناصر الأولى من الكائن.

########## القيمة الافتراضية لعدد الصفوف: 5

######### tail(): ترجع العناصر الأخيرة من الكائن.

########## القيمة الافتراضية لعدد الصفوف: 5

######### value_counts(): ترجع القيم الفريدة للكائن وعدد مرات تكرارها.

######### idxmax(): ترجع قيمة فهرس العنصر الأقصى.

######### idxmin(): ترجع قيمة فهرس العنصر الأدنى.

######## وظائف الفهرسة في كائن إطار البيانات (DataFrame):

######### head(): ترجع الصفوف الأولى من إطار البيانات.

########## مثال: `data.head(10)` لطباعة أول 10 صفوف.

######### tail(): ترجع الصفوف الأخيرة من إطار البيانات.

########## مثال: `data.tail()` لطباعة آخر 5 صفوف (افتراضيًا).

```

نقاط مهمة

تُستخدم الدالة `data.head(10)` لطباعة أول 10 صفوف من إطار البيانات.
تُستخدم الدالة `data.tail()` لطباعة آخر 5 صفوف من إطار البيانات (القيمة الافتراضية).
مثال عملي: الصفحة تحتوي على جدولين يوضحان نتائج تطبيق هذه الدوال على بيانات تعليمية (مدارس في الرياض ونجران).

📋 المحتوى المنظم

📖 محتوى تعليمي مفصّل

نوع: محتوى تعليمي

# Printing the first 10 rows of the table

نوع: محتوى تعليمي

data.head(10)

نوع: محتوى تعليمي

data.tail()

🔍 عناصر مرئية

📄 النص الكامل للصفحة

# Printing the first 10 rows of the table

data.head(10)

data.tail()

--- VISUAL CONTEXT ---
**TABLE**: Untitled
Description: No description
Table Structure:
Headers: المنطقة الإدارية | المرحلة | نوع المدرسة | مجموع المعلمين | مجموع الطلبة | مجموع المدرسة | تعليم مستمر
Rows:
Row 1: الرياض | 0 | 0 | 826 | الكبار | 0 | 0
Row 2: الرياض | 1 | المرحلة الابتدائية | تحفيظ | 1040 | 72 | 41
Row 3: الرياض | 2 | المرحلة الابتدائية | تربية خاصة | 190 | 123 | 10
Row 4: الرياض | 3 | المرحلة الابتدائية | نهاري | 34668 | 1843 | 1152
Row 5: الرياض | 4 | المرحلة الثانوية | تحفيظ | 285 | 41 | 0
Row 6: الرياض | 5 | المرحلة الثانوية | تربية خاصة | 71 | 19 | 0
Row 7: الرياض | 6 | المرحلة الثانوية | تعليم كبار | 183 | 0 | 0
Row 8: الرياض | 7 | المرحلة الثانوية | نهاري | 16018 | 980 | 462
Row 9: الرياض | 8 | المرحلة المتوسطة | تحفيظ | 548 | 42 | 34
Row 10: الرياض | 9 | المرحلة المتوسطة | تربية خاصة | 63 | 28 | 2
Calculation needed: This table displays data related to educational institutions, showing administrative regions, school levels, school types, teacher counts, student counts, and school totals.
Context: This table shows the first 10 rows of data, likely from a dataset about educational institutions.

**TABLE**: Untitled
Description: No description
Table Structure:
Headers: المنطقة الإدارية | المرحلة | نوع المدرسة | مجموع المعلمين | مجموع الطلبة | مجموع المدرسة | تعليم ابتدائي
Rows:
Row 1: نجران | المرحلة الابتدائية | نهاري | 18 | 215 | 0 | 0
Row 2: نجران | رياض الأطفال | نهاري | 40 | 154 | 0 | 0
Row 3: نجران | المرحلة الابتدائية | نهاري | 12 | 86 | 0 | 0
Row 4: نجران | المرحلة المتوسطة | نهاري | 3 | 15 | 0 | 0
Row 5: نجران | رياض الأطفال | نهاري | 2 | 19 | 0 | 0
Calculation needed: This table displays data for educational institutions in the Najaran administrative region.
Context: This table shows the last few rows of data, likely from a dataset about educational institutions.

🎴 بطاقات تعليمية للمراجعة

عدد البطاقات: 3 بطاقة لهذه الصفحة

في سياق تحليل البيانات باستخدام Pandas، ما الغرض من استخدام الدالة `data.head(10)`؟

أ) لحذف أول 10 صفوف من DataFrame لتنظيف البيانات.
ب) لعرض آخر 10 صفوف من DataFrame لفهم نهاية البيانات.
ج) لعرض أول 10 صفوف من DataFrame لفهم هيكل البيانات والقيم الأولية.
د) لحساب المتوسط الحسابي لأول 10 صفوف في كل عمود.

الإجابة الصحيحة: c

الإجابة: لعرض أول 10 صفوف من DataFrame لفهم هيكل البيانات والقيم الأولية.

الشرح: 1. `data.head()` هي دالة في مكتبة Pandas. 2. تستخدم لعرض أول عدد محدد من الصفوف في DataFrame. 3. `data.head(10)` تعني عرض أول 10 صفوف. 4. الغرض الأساسي هو استكشاف البيانات بسرعة: رؤية الأعمدة، أنواع البيانات، والقيم النموذجية.

تلميح: تساعد هذه الدالة في المرحلة الأولى من استكشاف البيانات قبل أي تحليل عميق.

التصنيف: تعريف | المستوى: سهل

ما الفرق الأساسي في الغرض بين استخدام الدالة `data.head()` والدالة `data.tail()` في Pandas؟

أ) `data.head()` تحسب الإحصاءات الوصفية، بينما `data.tail()` تعرض البيانات فقط.
ب) `data.head()` تعرض أول صفوف البيانات، بينما `data.tail()` تعرض آخر صفوف البيانات.
ج) `data.head()` تستخدم للبيانات الرقمية فقط، بينما `data.tail()` للبيانات النصية.
د) `data.head()` تعرض الأعمدة، بينما `data.tail()` تعرض الصفوف.

الإجابة الصحيحة: b

الإجابة: `data.head()` تعرض أول صفوف البيانات، بينما `data.tail()` تعرض آخر صفوف البيانات.

الشرح: 1. `data.head(n)`: تعرض أول `n` صفوف من بداية DataFrame. 2. `data.tail(n)`: تعرض آخر `n` صفوف من نهاية DataFrame. 3. الفرق هو موقع الصفوف المعروضة: البداية مقابل النهاية. 4. كلاهما مفيدان للتحقق من تناسق البيانات في أجزاء مختلفة منها.

تلميح: كلتاهما تستخدمان للفحص السريع، لكن من طرفي مختلفين من مجموعة البيانات.

التصنيف: فرق بين مفهومين | المستوى: سهل

بناءً على هيكل الجدول المعروض، إذا أردنا معرفة عدد المعلمين في المدارس النهارية بالمرحلة الابتدائية في منطقة الرياض باستخدام Pandas، فأي من العمليات التالية هي الأكثر ملاءمة كخطوة أولى؟

أ) حذف جميع الأعمدة ما عدا عمود `مجموع المعلمين`.
ب) ترتيب DataFrame تنازلياً حسب عمود `مجموع المعلمين`.
ج) تصفية DataFrame باستخدام شروط متعددة للوصول للصفوف المحددة.
د) دمج DataFrame مع مجموعة بيانات أخرى عن المناطق.

الإجابة الصحيحة: c

الإجابة: تصفية DataFrame باستخدام شروط متعددة للوصول للصفوف المحددة.

الشرح: 1. الخطوة هي تصفية (Filtering) البيانات. 2. نحدد الشروط: `المنطقة الإدارية == 'الرياض'` و `المرحلة == 'المرحلة الابتدائية'` و `نوع المدرسة == 'نهاري'`. 3. في Pandas، يمكن استخدام الأقواس المعقوفة مع شروط منطقية. 4. بعد التصفية، نصل إلى العمود `مجموع المعلمين` للصفوف المطابقة.

تلميح: فكر في كيفية عزل صفوف معينة بناءً على قيم في أعمدة محددة.

التصنيف: خطوات | المستوى: متوسط