صفحة 114 - كتاب علم البيانات - الصف 11 - الفصل 1 - المنهج السعودي - وزارة التعليم

📚 معلومات الصفحة

الكتاب: كتاب علم البيانات - الصف 11 - الفصل 1 | المادة: علم البيانات | المرحلة: الصف 11 | الفصل الدراسي: 1

الدولة: المملكة العربية السعودية | المنهج: المنهج السعودي - وزارة التعليم

نوع المحتوى: درس تعليمي

📝 ملخص الصفحة

📚 الفهرسة في Pandas

المفاهيم الأساسية

الفهرس (Index): قائمة بالأعداد الصحيحة أو التسميات التي تستخدم لتحديد الصفوف أو الأعمدة بشكل فريد.

اختيار مجموعة بيانات جزئية (Subset Selection): مصطلح آخر للفهرسة.

خريطة المفاهيم

```markmap

فحص وتحليل البيانات

أدوات تحليل البيانات

لغات البرمجة والبيانات البرمجية

#### بايثون (Python)

##### مفكرة جوبيتر (Jupyter Notebook)

###### فتح ملفات Excel في Jupyter

####### الشرط: أن يكون ملف Excel والمفكرة في نفس المجلد.

##### مكتبات البايثون

###### مكتبة بانداس (Pandas)

####### كائنات المكتبة الرئيسية

######## إطار البيانات (DataFrame Object)

######### إنشاء إطار بيانات من ملف Excel

########## الوظيفة: `pd.read_excel('filename.xlsx')`

########## قراءة ورقة عمل محددة: استخدام وسيط `sheet_name`

######### سمات كائن إطار البيانات (Attributes)

########## shape: ترجع أبعاد إطار البيانات (عدد الصفوف والأعمدة).

########## size: ترجع العدد الإجمالي للعناصر في إطار البيانات (n x m).

########## dtypes: ترجع نوع القيمة لكل عمود.

########## axes: ترجع عدد الصفوف وأسماء الأعمدة.

########## أنواع البيانات في Pandas مقابل Python

########### (انظر الجدول أدناه)

####### الفهرسة (Indexing)

######## تعريف: اختيار محدد للصفوف والأعمدة من إطار البيانات.

######## أنواع الاختيار:

######### جميع الصفوف وبعض الأعمدة.

######### بعض الصفوف وجميع الأعمدة.

######### بعض من كل صف وعمود.

######## وظائف الفهرسة في كائن المتسلسلة (Series):

######### head(): ترجع العناصر الأولى من الكائن.

######### tail(): ترجع العناصر الأخيرة من الكائن.

######### value_counts(): ترجع القيم الفريدة للكائن وعدد مرات تكرارها.

######### idxmax(): ترجع قيمة فهرس العنصر الأقصى.

######### idxmin(): ترجع قيمة فهرس العنصر الأدنى.

```

نقاط مهمة

الفهرسة هي عملية اختيار مجموعة جزئية من البيانات (صفوف وأعمدة).
يمكن تطبيق وظائف الفهرسة (`head`, `tail`, `value_counts`, `idxmax`, `idxmin`) على كائن المتسلسلة (Series) في Pandas.
مثال على كائن متسلسلة يحتوي على أرقام من -3 إلى 8، مع تكرار الرقم 5 ثلاث مرات.

📄 النص الكامل للصفحة

الفهرس (Index) هو قائمة بالأعداد الصحيحة أو التسميات التي تستخدمها لتحديد الصفوف أو الأعمدة بشكل فريد. في بانداس، تتضمن الفهرسة
بشكل أساسي اختيارا محددًا للصفوف والأعمدة من البيانات من إطار البيانات، حيث يمكن اختيار جميع الصفوف وبعض الأعمدة، أو اختيار بعض
الصفوف وجميع الأعمدة، أو بعض من كل صف وعمود . اختيار مجموعة بيانات جزئية (Subset Selection) هو مصطلح آخر للفهرسة.
لتشاهد بعض الأمثلة على الوظائف التي يمكنك استخدامها للفهرسة.

--- SECTION: الجدول 3.8 وظائف الفهرسة ---
الجدول 3.8 وظائف الفهرسة

--- SECTION: استخدام الفهرسة في كائن المتسلسلة Using Indexing in a Series Object ---
استخدام الفهرسة في كائن المتسلسلة Using Indexing in a Series Object
طبق وظائف الفهرسة هذه على كائن المتسلسلة الذي قمت بإنشائه. اطبع كائن المتسلسلة أولا، لتذكر محتوياته.

print(s)
0 -3
1 -2
2 -1
3 0
4 1
5 2
6 3
7 4
8 5
9 5
10 5
11 6
12 7
13 8
Name: Numbers, dtype: int64

كائن المتسلسلة.

--- VISUAL CONTEXT ---
**TABLE**: وظائف الفهرسة
Description: A table describing indexing functions and their meanings.
Table Structure:
Headers: الوظيفة | المعنى
Rows:
Row 1: head() | ترجع العناصر الأولى من الكائن.
Row 2: tail() | ترجع العناصر الأخيرة من الكائن.
Row 3: value_counts() | رجع القيم الفريدة للكائن وعدد مرات تكرارها.
Row 4: idxmax() | ترجع قيمة فهرس العنصر الأقصى.
Row 5: idxmin() | ترجع قيمة فهرس العنصر الأدنى.
Context: Describes functions used for indexing in pandas.

**DIAGRAM**: Untitled
Description: A diagram showing the output of print(s) for a series object.
Context: Illustrates the output of a series object.

🎴 بطاقات تعليمية للمراجعة

عدد البطاقات: 5 بطاقة لهذه الصفحة

ما المقصود بالفهرسة (Indexing) في مكتبة pandas؟

أ) هي عملية فرز البيانات تصاعدياً أو تنازلياً بناءً على عمود معين.
ب) هي عملية اختيار محدد للصفوف والأعمدة من إطار البيانات، ويمكن أن تشمل اختيار جميع الصفوف وبعض الأعمدة، أو بعض الصفوف وجميع الأعمدة، أو بعض من كل صف وعمود.
ج) هي عملية حساب الإحصاءات الوصفية مثل المتوسط والوسيط للبيانات.
د) هي عملية دمج إطارين أو أكثر من البيانات في إطار واحد.

الإجابة الصحيحة: b

الإجابة: هي عملية اختيار محدد للصفوف والأعمدة من إطار البيانات، ويمكن أن تشمل اختيار جميع الصفوف وبعض الأعمدة، أو بعض الصفوف وجميع الأعمدة، أو بعض من كل صف وعمود.

الشرح: الفهرسة هي آلية أساسية في pandas للوصول إلى البيانات وتحديدها. يمكن استخدامها لاستخراج مجموعات فرعية من البيانات بناءً على مواقع الصفوف والأعمدة أو قيم الفهرس. المصطلح 'اختيار مجموعة بيانات جزئية' (Subset Selection) هو مرادف لها.

تلميح: تتعلق هذه العملية باستخراج أجزاء محددة من مجموعة البيانات.

التصنيف: تعريف | المستوى: سهل

ما وظيفة `head()` في pandas؟

أ) ترجع القيم الفريدة للكائن وعدد مرات تكرارها.
ب) ترجع قيمة فهرس العنصر الأقصى.
ج) ترجع العناصر الأولى من الكائن.
د) ترجع العناصر الأخيرة من الكائن.

الإجابة الصحيحة: c

الإجابة: ترجع العناصر الأولى من الكائن.

الشرح: تُستخدم الدالة `head()` لعرض الصفوف الأولى من كائن Series أو DataFrame. تساعد في فحص البيانات بسرعة دون عرض المجموعة الكاملة، وغالباً ما تستخدم مع المعامل الافتراضي n=5.

تلميح: تستخدم هذه الوظيفة للحصول على نظرة سريعة على بداية مجموعة البيانات.

التصنيف: تعريف | المستوى: سهل

ما وظيفة `value_counts()` في pandas؟

أ) ترجع العناصر الأولى من الكائن.
ب) ترجع القيم الفريدة للكائن وعدد مرات تكرارها.
ج) ترجع قيمة فهرس العنصر الأدنى.
د) ترجع العناصر الأخيرة من الكائن.

الإجابة الصحيحة: b

الإجابة: ترجع القيم الفريدة للكائن وعدد مرات تكرارها.

الشرح: تُستخدم الدالة `value_counts()` على كائن Series لحساب عدد مرات ظهور كل قيمة فريدة. تُرجع النتيجة ككائن Series جديد حيث تكون القيم الفريدة هي الفهرس، وعدد التكرارات هي القيم. مفيدة جداً في التحليل الاستكشافي للبيانات.

تلميح: تساعد هذه الوظيفة في تحليل توزيع وتكرار القيم في عمود أو متسلسلة.

التصنيف: تعريف | المستوى: متوسط

ما الفرق الرئيسي بين وظيفتي `idxmax()` و `idxmin()` في pandas؟

أ) ترجع `idxmax()` أكبر قيمة في الكائن، بينما ترجع `idxmin()` أصغر قيمة.
ب) ترجع `idxmax()` قيمة فهرس العنصر الأقصى (الأكبر)، بينما ترجع `idxmin()` قيمة فهرس العنصر الأدنى (الأصغر).
ج) ترجع `idxmax()` عدد العناصر، بينما ترجع `idxmin()` متوسط القيم.
د) ترجع `idxmax()` العناصر الأولى، بينما ترجع `idxmin()` العناصر الأخيرة.

الإجابة الصحيحة: b

الإجابة: ترجع `idxmax()` قيمة فهرس العنصر الأقصى (الأكبر)، بينما ترجع `idxmin()` قيمة فهرس العنصر الأدنى (الأصغر).

الشرح: كلتا الدالتين تعملان على كائن Series. `idxmax()` تبحث عن أكبر قيمة في السلسلة وتُرجع الفهرس (الموقع أو التسمية) المرتبط بتلك القيمة القصوى. بالمقابل، `idxmin()` تبحث عن أصغر قيمة وتُرجع الفهرس المرتبط بها. الناتج هو الفهرس، وليس القيمة العددية.

تلميح: كلتاهما تعملان على الفهرس، وليس على القيمة نفسها.

التصنيف: فرق بين مفهومين | المستوى: متوسط

إذا أردت الحصول على نظرة سريعة على نهاية مجموعة بيانات مخزنة في كائن Series اسمه `s`، أي دالة من دوال الفهرسة يجب استخدامها؟

أ) الدالة `head()`.
ب) الدالة `value_counts()`.
ج) الدالة `tail()`.
د) الدالة `idxmax()`.

الإجابة الصحيحة: c

الإجابة: الدالة `tail()`.

الشرح: تُستخدم الدالة `tail()` لعرض الصفوف الأخيرة من كائن Series أو DataFrame. مثل `head()`، تساعد في فحص نهاية البيانات بسرعة. الاستخدام الشائع هو `s.tail()` أو `s.tail(10)` لعرض 10 صفوف أخيرة.

تلميح: هذه الدالة هي عكس الدالة المستخدمة لرؤية بداية البيانات.

التصنيف: مفهوم جوهري | المستوى: سهل