صفحة 116 - كتاب علم البيانات - الصف 11 - الفصل 1 - المملكة العربية السعودية

الكتاب: كتاب علم البيانات - الصف 11 - الفصل 1 | المادة: علم البيانات | المرحلة: الصف 11 | الفصل الدراسي: 1

الدولة: المملكة العربية السعودية | المنهج: المنهج السعودي - وزارة التعليم

📚 معلومات الصفحة

الكتاب: كتاب علم البيانات - الصف 11 - الفصل 1 | المادة: علم البيانات | المرحلة: الصف 11 | الفصل الدراسي: 1

الدولة: المملكة العربية السعودية | المنهج: المنهج السعودي - وزارة التعليم

نوع المحتوى: درس تعليمي

📝 ملخص الصفحة

📚 استخدام الفهرسة في كائن إطار البيانات

المفاهيم الأساسية

الفهرسة (Indexing): اختيار محدد للصفوف والأعمدة من إطار البيانات.

خريطة المفاهيم

```markmap

فحص وتحليل البيانات

أدوات تحليل البيانات

لغات البرمجة والبيانات البرمجية

#### بايثون (Python)

##### مفكرة جوبيتر (Jupyter Notebook)

###### فتح ملفات Excel في Jupyter

####### الشرط: أن يكون ملف Excel والمفكرة في نفس المجلد.

##### مكتبات البايثون

###### مكتبة بانداس (Pandas)

####### كائنات المكتبة الرئيسية

######## إطار البيانات (DataFrame Object)

######### إنشاء إطار بيانات من ملف Excel

########## الوظيفة: `pd.read_excel('filename.xlsx')`

########## قراءة ورقة عمل محددة: استخدام وسيط `sheet_name`

######### سمات كائن إطار البيانات (Attributes)

########## shape: ترجع أبعاد إطار البيانات (عدد الصفوف والأعمدة).

########## size: ترجع العدد الإجمالي للعناصر في إطار البيانات (n x m).

########## dtypes: ترجع نوع القيمة لكل عمود.

########## axes: ترجع عدد الصفوف وأسماء الأعمدة.

########## أنواع البيانات في Pandas مقابل Python

########### (انظر الجدول أدناه)

####### الفهرسة (Indexing)

######## تعريف: اختيار محدد للصفوف والأعمدة من إطار البيانات.

######## أنواع الاختيار:

######### جميع الصفوف وبعض الأعمدة.

######### بعض الصفوف وجميع الأعمدة.

######### بعض من كل صف وعمود.

######## وظائف الفهرسة في كائن المتسلسلة (Series):

######### head(): ترجع العناصر الأولى من الكائن.

########## القيمة الافتراضية لعدد الصفوف: 5

######### tail(): ترجع العناصر الأخيرة من الكائن.

########## القيمة الافتراضية لعدد الصفوف: 5

######### value_counts(): ترجع القيم الفريدة للكائن وعدد مرات تكرارها.

######### idxmax(): ترجع قيمة فهرس العنصر الأقصى.

######### idxmin(): ترجع قيمة فهرس العنصر الأدنى.

######## وظائف الفهرسة في كائن إطار البيانات (DataFrame):

######### head(): ترجع الصفوف الأولى من إطار البيانات.

########## مثال: `data.head(10)` لطباعة أول 10 صفوف.

######### tail(): ترجع الصفوف الأخيرة من إطار البيانات.

########## مثال: `data.tail()` لطباعة آخر 5 صفوف (افتراضيًا).

```

نقاط مهمة

  • تُستخدم الدالة `data.head(10)` لطباعة أول 10 صفوف من إطار البيانات.
  • تُستخدم الدالة `data.tail()` لطباعة آخر 5 صفوف من إطار البيانات (القيمة الافتراضية).
  • مثال عملي: الصفحة تحتوي على جدولين يوضحان نتائج تطبيق هذه الدوال على بيانات تعليمية (مدارس في الرياض ونجران).

📋 المحتوى المنظم

📖 محتوى تعليمي مفصّل

نوع: محتوى تعليمي

# Printing the first 10 rows of the table

نوع: محتوى تعليمي

data.head(10)

نوع: محتوى تعليمي

data.tail()

🔍 عناصر مرئية

📄 النص الكامل للصفحة

# Printing the first 10 rows of the table data.head(10) data.tail() --- VISUAL CONTEXT --- **TABLE**: Untitled Description: No description Table Structure: Headers: المنطقة الإدارية | المرحلة | نوع المدرسة | مجموع المعلمين | مجموع الطلبة | مجموع المدرسة | تعليم مستمر Rows: Row 1: الرياض | 0 | 0 | 826 | الكبار | 0 | 0 Row 2: الرياض | 1 | المرحلة الابتدائية | تحفيظ | 1040 | 72 | 41 Row 3: الرياض | 2 | المرحلة الابتدائية | تربية خاصة | 190 | 123 | 10 Row 4: الرياض | 3 | المرحلة الابتدائية | نهاري | 34668 | 1843 | 1152 Row 5: الرياض | 4 | المرحلة الثانوية | تحفيظ | 285 | 41 | 0 Row 6: الرياض | 5 | المرحلة الثانوية | تربية خاصة | 71 | 19 | 0 Row 7: الرياض | 6 | المرحلة الثانوية | تعليم كبار | 183 | 0 | 0 Row 8: الرياض | 7 | المرحلة الثانوية | نهاري | 16018 | 980 | 462 Row 9: الرياض | 8 | المرحلة المتوسطة | تحفيظ | 548 | 42 | 34 Row 10: الرياض | 9 | المرحلة المتوسطة | تربية خاصة | 63 | 28 | 2 Calculation needed: This table displays data related to educational institutions, showing administrative regions, school levels, school types, teacher counts, student counts, and school totals. Context: This table shows the first 10 rows of data, likely from a dataset about educational institutions. **TABLE**: Untitled Description: No description Table Structure: Headers: المنطقة الإدارية | المرحلة | نوع المدرسة | مجموع المعلمين | مجموع الطلبة | مجموع المدرسة | تعليم ابتدائي Rows: Row 1: نجران | المرحلة الابتدائية | نهاري | 18 | 215 | 0 | 0 Row 2: نجران | رياض الأطفال | نهاري | 40 | 154 | 0 | 0 Row 3: نجران | المرحلة الابتدائية | نهاري | 12 | 86 | 0 | 0 Row 4: نجران | المرحلة المتوسطة | نهاري | 3 | 15 | 0 | 0 Row 5: نجران | رياض الأطفال | نهاري | 2 | 19 | 0 | 0 Calculation needed: This table displays data for educational institutions in the Najaran administrative region. Context: This table shows the last few rows of data, likely from a dataset about educational institutions.

🎴 بطاقات تعليمية للمراجعة

عدد البطاقات: 3 بطاقة لهذه الصفحة

في سياق تحليل البيانات باستخدام Pandas، ما الغرض من استخدام الدالة `data.head(10)`؟

  • أ) لحذف أول 10 صفوف من DataFrame لتنظيف البيانات.
  • ب) لعرض آخر 10 صفوف من DataFrame لفهم نهاية البيانات.
  • ج) لعرض أول 10 صفوف من DataFrame لفهم هيكل البيانات والقيم الأولية.
  • د) لحساب المتوسط الحسابي لأول 10 صفوف في كل عمود.

الإجابة الصحيحة: c

الإجابة: لعرض أول 10 صفوف من DataFrame لفهم هيكل البيانات والقيم الأولية.

الشرح: 1. `data.head()` هي دالة في مكتبة Pandas. 2. تستخدم لعرض أول عدد محدد من الصفوف في DataFrame. 3. `data.head(10)` تعني عرض أول 10 صفوف. 4. الغرض الأساسي هو استكشاف البيانات بسرعة: رؤية الأعمدة، أنواع البيانات، والقيم النموذجية.

تلميح: تساعد هذه الدالة في المرحلة الأولى من استكشاف البيانات قبل أي تحليل عميق.

التصنيف: تعريف | المستوى: سهل

ما الفرق الأساسي في الغرض بين استخدام الدالة `data.head()` والدالة `data.tail()` في Pandas؟

  • أ) `data.head()` تحسب الإحصاءات الوصفية، بينما `data.tail()` تعرض البيانات فقط.
  • ب) `data.head()` تعرض أول صفوف البيانات، بينما `data.tail()` تعرض آخر صفوف البيانات.
  • ج) `data.head()` تستخدم للبيانات الرقمية فقط، بينما `data.tail()` للبيانات النصية.
  • د) `data.head()` تعرض الأعمدة، بينما `data.tail()` تعرض الصفوف.

الإجابة الصحيحة: b

الإجابة: `data.head()` تعرض أول صفوف البيانات، بينما `data.tail()` تعرض آخر صفوف البيانات.

الشرح: 1. `data.head(n)`: تعرض أول `n` صفوف من بداية DataFrame. 2. `data.tail(n)`: تعرض آخر `n` صفوف من نهاية DataFrame. 3. الفرق هو موقع الصفوف المعروضة: البداية مقابل النهاية. 4. كلاهما مفيدان للتحقق من تناسق البيانات في أجزاء مختلفة منها.

تلميح: كلتاهما تستخدمان للفحص السريع، لكن من طرفي مختلفين من مجموعة البيانات.

التصنيف: فرق بين مفهومين | المستوى: سهل

بناءً على هيكل الجدول المعروض، إذا أردنا معرفة عدد المعلمين في المدارس النهارية بالمرحلة الابتدائية في منطقة الرياض باستخدام Pandas، فأي من العمليات التالية هي الأكثر ملاءمة كخطوة أولى؟

  • أ) حذف جميع الأعمدة ما عدا عمود `مجموع المعلمين`.
  • ب) ترتيب DataFrame تنازلياً حسب عمود `مجموع المعلمين`.
  • ج) تصفية DataFrame باستخدام شروط متعددة للوصول للصفوف المحددة.
  • د) دمج DataFrame مع مجموعة بيانات أخرى عن المناطق.

الإجابة الصحيحة: c

الإجابة: تصفية DataFrame باستخدام شروط متعددة للوصول للصفوف المحددة.

الشرح: 1. الخطوة هي تصفية (Filtering) البيانات. 2. نحدد الشروط: `المنطقة الإدارية == 'الرياض'` و `المرحلة == 'المرحلة الابتدائية'` و `نوع المدرسة == 'نهاري'`. 3. في Pandas، يمكن استخدام الأقواس المعقوفة مع شروط منطقية. 4. بعد التصفية، نصل إلى العمود `مجموع المعلمين` للصفوف المطابقة.

تلميح: فكر في كيفية عزل صفوف معينة بناءً على قيم في أعمدة محددة.

التصنيف: خطوات | المستوى: متوسط