صفحة 122 - كتاب علم البيانات - الصف 11 - الفصل 1 - المملكة العربية السعودية

الكتاب: كتاب علم البيانات - الصف 11 - الفصل 1 | المادة: علم البيانات | المرحلة: الصف 11 | الفصل الدراسي: 1

الدولة: المملكة العربية السعودية | المنهج: المنهج السعودي - وزارة التعليم

📚 معلومات الصفحة

الكتاب: كتاب علم البيانات - الصف 11 - الفصل 1 | المادة: علم البيانات | المرحلة: الصف 11 | الفصل الدراسي: 1

الدولة: المملكة العربية السعودية | المنهج: المنهج السعودي - وزارة التعليم

نوع المحتوى: درس تعليمي

📝 ملخص الصفحة

📚 المجموعات والتجميع (Grouping and Aggregating)

المفاهيم الأساسية

التجميع (Grouping): عملية وضع عناصر مجموعة البيانات في مجموعات بناءً على بعض المعايير وتطبيق الوظائف على هذه المجموعات.

دالة التجميع (Aggregate Function): دالة تقوم بحسابات رياضية على قيم صفوف متعددة مجمعة معًا، وترجع قيمة موجزة واحدة.

خريطة المفاهيم

```markmap

استكشاف البيانات

تصفية البيانات (اختيار مجموعة جزئية)

تعريف: اختيار جزء أصغر من البيانات للعرض أو التحليل

طرق التصفية

#### الفهرسة المنطقية (Boolean Indexing)

##### الأسهل

##### تستخدم القيم الفعلية والمعاملات المنطقية

##### أمثلة على كائن المتسلسلة (Series)

###### s[s > 0]

###### s[(s<-1) | (s > 6)]

###### s[~(s<0)]

#### طرق loc و iloc

##### الأكثر قوة

##### طريقة loc

###### تختار الصفوف والأعمدة باستخدام مُسميات محددة (أسماء الأعمدة)

##### طريقة iloc

###### تختار الصفوف والأعمدة باستخدام مواضع صحيحة (أرقام الصفوف والأعمدة)

###### مثال: data.iloc[0] (تحديد جميع عناصر الصف الأول)

###### طباعة عنصر محدد

####### مثال: `data.iloc[0,3]` (طباعة العنصر في الصف الأول، العمود الرابع)

###### طباعة نطاق من العناصر

####### مثال: `data.iloc[1:3, 0:3]` (طباعة الصفوف من 2 إلى 3، والأعمدة من 1 إلى 3)

####### ملاحظة: النهاية غير مشمولة في النطاق

###### التكرار عبر الصفوف باستخدام حلقة for

####### مثال: `for i in range(10): print(studentsReg.iloc[i][1])`

######## يطبع أول 10 صفوف من العمود الثاني

طباعة أسماء الأعمدة

الوصول إلى السمة `columns`

استخدام حلقة `for` للطباعة

الحصول على إحصائيات أساسية

استخدام `data.describe()`

الإحصائيات المعروضة

#### count (العدد)

#### mean (المتوسط)

#### std (الانحراف المعياري)

#### min (القيمة الدنيا)

#### 25%، 50%، 75% (الربيعيات)

#### max (القيمة القصوى)

إنشاء إطار بيانات جديد

اختيار أعمدة محددة من إطار بيانات موجود

مثال: studentsReg = data.loc[:, ['المنطقة الإدارية', 'مجموع الطلبة']]

المجموعات والتجميع (Grouping and Aggregating)

التجميع (Grouping)

#### تعريف: وضع عناصر البيانات في مجموعات بناءً على معايير وتطبيق دوال عليها

#### التنفيذ: باستخدام وظيفة `df.groupby()` في بايثن

دالة التجميع (Aggregate Function)

#### تعريف: دالة رياضية تُطبق على صفوف مجمعة وتُرجع قيمة موجزة

#### أمثلة شائعة

##### sum: مجموع قائمة الأرقام

##### max: العدد الأقصى لقائمة الأرقام

##### min: العدد الأدنى لقائمة الأرقام

##### mean: متوسط قائمة الأرقام

وظيفة Groupby

#### الغرض: تقسيم البيانات إلى مجموعات لإجراء حسابات وتحليل أفضل

#### مثال تطبيقي

##### تجميع الطلبة حسب المنطقة الإدارية وحساب المجموع

###### الكود: `df.groupby('المنطقة الإدارية').sum()`

```

نقاط مهمة

  • يتم تنفيذ عملية التجميع في مكتبة بايثن باستخدام وظيفة `df.groupby()`.
  • مثال: لتجميع بيانات عن لاعبي كرة السلة حسب الفريق وحساب عددهم، يتم التجميع حسب عمود "الفريق" وتطبيق دالة `sum`.
  • دوال التجميع (مثل `sum`, `count`, `min`, `max`, `mean`) تُطبق على البيانات بعد تجميعها.
  • مثال تطبيقي: تجميع الطلبة في كل منطقة إدارية وحساب مجموع الطلبة في كل منطقة باستخدام `df.groupby('المنطقة الإدارية').sum()`.

📋 المحتوى المنظم

📖 محتوى تعليمي مفصّل

نوع: محتوى تعليمي

المجموعات والتجميع

نوع: محتوى تعليمي

Grouping and Aggregating

نوع: محتوى تعليمي

تسمى عملية وضع عناصر مجموعة البيانات في مجموعات بناءً على بعض المعايير وتطبيق الوظائف على هذه المجموعات بالتجميع. في مكتبة بايثن، يتم تنفيذ هذا الإجراء باستخدام وظيفة (df.groupby()).

نوع: محتوى تعليمي

فسي سبل المثال، تخيل أن لديك كرة السلة في كل العصور. إذا كنت ترغب في معرفة عدد اللاعبين في مجموعة البيانات هذه لفريق معين، فيمكنك تجميع هذه البيانات حسب عمود "الفريق" وتطبيق دالة المجموع ((sum)) على البيانات المجمعة.

نوع: محتوى تعليمي

دالة التجميع (Aggregate Function)

نوع: محتوى تعليمي

دالة تقوم بحسابات رياضية مع قيم صفوف متعددة والتي يتم تجميعها معًا، ونتيجة لذلك ترجع قيمة موجزة واحدة. دوال التجميع الأكثر شيوعًا هي: sum، count، min، max، mean.

نوع: محتوى تعليمي

الجدول 3.10: الدوال التجميعية

نوع: محتوى تعليمي

نوع: محتوى تعليمي

وظيفة Groupby

نوع: محتوى تعليمي

Groupby Method

نوع: محتوى تعليمي

باستخدام وظيفة ( )groupby يمكنك تقسيم بياناتك إلى مجموعات مختلفة، ويمكن أن يساعدك هذا في إجراء حسابات لتحليل البيانات بشكل أفضل.

نوع: محتوى تعليمي

لتشاهد بعض الأمثلة لوظيفة ( )groupby في إطار البيانات الجديد الذي أنشأته.

نوع: محتوى تعليمي

في هذا المثال، ستقوم بتجميع الطلبة في كل منطقة وتحسب مجموع الطلبة في كل منطقة.

نوع: محتوى تعليمي

# Create a dataframe with two rows, one being Regions and the other one the total number of students df.groupby('المنطقة الإدارية').sum()

نوع: محتوى تعليمي

دالة sum هي إحدى دوال التجميع التي تدعمها مكتبة بايثن.

نوع: محتوى تعليمي

الشكل 3.27: استخدام df.groupby لتجميع إطار البيانات بعمود واحد

نوع: METADATA

وزارة التعليم

نوع: METADATA

Ministry of Education

نوع: METADATA

2025 - 1447

🔍 عناصر مرئية

A text box explaining that the sum function is one of the aggregate functions supported by the Python library.

📄 النص الكامل للصفحة

المجموعات والتجميع Grouping and Aggregating تسمى عملية وضع عناصر مجموعة البيانات في مجموعات بناءً على بعض المعايير وتطبيق الوظائف على هذه المجموعات بالتجميع. في مكتبة بايثن، يتم تنفيذ هذا الإجراء باستخدام وظيفة (df.groupby()). فسي سبل المثال، تخيل أن لديك كرة السلة في كل العصور. إذا كنت ترغب في معرفة عدد اللاعبين في مجموعة البيانات هذه لفريق معين، فيمكنك تجميع هذه البيانات حسب عمود "الفريق" وتطبيق دالة المجموع ((sum)) على البيانات المجمعة. دالة التجميع (Aggregate Function) دالة تقوم بحسابات رياضية مع قيم صفوف متعددة والتي يتم تجميعها معًا، ونتيجة لذلك ترجع قيمة موجزة واحدة. دوال التجميع الأكثر شيوعًا هي: sum، count، min، max، mean. الجدول 3.10: الدوال التجميعية وظيفة Groupby Groupby Method باستخدام وظيفة ( )groupby يمكنك تقسيم بياناتك إلى مجموعات مختلفة، ويمكن أن يساعدك هذا في إجراء حسابات لتحليل البيانات بشكل أفضل. لتشاهد بعض الأمثلة لوظيفة ( )groupby في إطار البيانات الجديد الذي أنشأته. في هذا المثال، ستقوم بتجميع الطلبة في كل منطقة وتحسب مجموع الطلبة في كل منطقة. # Create a dataframe with two rows, one being Regions and the other one the total number of students df.groupby('المنطقة الإدارية').sum() دالة sum هي إحدى دوال التجميع التي تدعمها مكتبة بايثن. الشكل 3.27: استخدام df.groupby لتجميع إطار البيانات بعمود واحد وزارة التعليم Ministry of Education 2025 - 1447 --- VISUAL CONTEXT --- **TABLE**: Untitled Description: No description Table Structure: Headers: الدالة | المعنى Rows: Row 1: sum | ترجع مجموع قائمة الأرقام. Row 2: max | ترجع العدد الأقصى لقائمة الأرقام. Row 3: min | ترجع العدد الأدنى لقائمة الأرقام. Row 4: mean | ترجع متوسط قائمة الأرقام. Context: Lists common aggregate functions and their meanings in Arabic. **TABLE**: Untitled Description: No description Table Structure: Headers: المنطقة الإدارية | مجموع الطلبة Rows: Row 1: البيانات | 84464 Row 2: الحدود الشمالية | 151527 Row 3: الحدود الشمالية | 88482 Row 4: الرياض | 1473236 Row 5: الشرقية | 909884 Row 6: القصيم | 292996 Row 7: المدينة المنورة | 443254 Row 8: تبوك | 205673 Row 9: جازان | 354608 Row 10: حائل | 162609 Row 11: عسير | 480060 Row 12: مكة المكرمة | 1421176 Row 13: نجران | 145397 Context: Shows the result of grouping by 'المنطقة الإدارية' and summing the number of students. **TEXT_BOX**: Untitled Description: A text box explaining that the sum function is one of the aggregate functions supported by the Python library. Context: Provides context for the 'sum' function used in the example.

🎴 بطاقات تعليمية للمراجعة

عدد البطاقات: 5 بطاقة لهذه الصفحة

ما هي عملية التجميع (Grouping and Aggregating) في علم البيانات؟

  • أ) هي عملية فرز البيانات تصاعدياً أو تنازلياً بناءً على عمود معين.
  • ب) هي عملية وضع عناصر مجموعة البيانات في مجموعات بناءً على بعض المعايير وتطبيق الوظائف (الدوال التجميعية) على هذه المجموعات.
  • ج) هي عملية حذف البيانات المكررة أو القيم الفارغة من مجموعة البيانات.
  • د) هي عملية دمج إطارين أو أكثر من البيانات في إطار بيانات واحد.

الإجابة الصحيحة: b

الإجابة: هي عملية وضع عناصر مجموعة البيانات في مجموعات بناءً على بعض المعايير وتطبيق الوظائف (الدوال التجميعية) على هذه المجموعات.

الشرح: 1. التجميع هو مفهوم أساسي في تحليل البيانات. 2. الخطوة الأولى: تقسيم البيانات إلى مجموعات متجانسة بناءً على معيار محدد (مثل: الفريق، المنطقة). 3. الخطوة الثانية: تطبيق دالة تجميعية (مثل: sum, count) على كل مجموعة لاستخراج قيمة موجزة واحدة تمثلها.

تلميح: تتضمن خطوتين رئيسيتين: التقسيم ثم التطبيق.

التصنيف: تعريف | المستوى: سهل

ما هي الدالة التجميعية (Aggregate Function)؟

  • أ) هي دالة تقوم بتحويل نوع البيانات في عمود معين من نصي إلى رقمي.
  • ب) هي دالة تقوم بإنشاء تصور بياني مباشر من إطار البيانات.
  • ج) هي دالة تقوم بحسابات رياضية مع قيم صفوف متعددة مجمعة معًا، وترجع نتيجة لذلك قيمة موجزة واحدة.
  • د) هي دالة تقوم بتصفية البيانات وعرض الصفوف التي تستوفي شرطاً محدداً فقط.

الإجابة الصحيحة: c

الإجابة: هي دالة تقوم بحسابات رياضية مع قيم صفوف متعددة مجمعة معًا، وترجع نتيجة لذلك قيمة موجزة واحدة.

الشرح: 1. الدالة التجميعية تعمل على مجموعة من القيم (صفوف متعددة). 2. تقوم بإجراء عملية حسابية محددة عليها (جمع، عد، متوسط...). 3. الناتج هو قيمة واحدة موجزة تلخص المجموعة.

تلميح: تعمل على بيانات مجمعة وليس على صف منفرد.

التصنيف: تعريف | المستوى: سهل

ما الغرض الرئيسي من استخدام وظيفة `groupby()` في مكتبة pandas؟

  • أ) حذف الأعمدة غير المرغوب فيها من إطار البيانات لتبسيطه.
  • ب) تقسيم البيانات إلى مجموعات مختلفة بناءً على معيار محدد، مما يساعد في إجراء حسابات وتحليلات أكثر دقة على كل مجموعة على حدة.
  • ج) تشفير البيانات النصية وتحويلها إلى رموز رقمية لفهمها الآلي.
  • د) ربط إطار البيانات بقاعدة بيانات خارجية لاستيراد المزيد من السجلات.

الإجابة الصحيحة: b

الإجابة: تقسيم البيانات إلى مجموعات مختلفة بناءً على معيار محدد، مما يساعد في إجراء حسابات وتحليلات أكثر دقة على كل مجموعة على حدة.

الشرح: 1. وظيفة `groupby()` هي الأداة الرئيسية لتنفيذ عملية التجميع. 2. تقسم البيانات إلى مجموعات متجانسة (مثل: طلاب كل منطقة). 3. هذا التقسيم يسمح بتطبيق دوال تجميعية (مثل sum) على كل مجموعة لاستخراج إحصاءات خاصة بها.

تلميح: الهدف هو تمكين التحليل على مستوى المجموعات الفرعية وليس مجموعة البيانات ككل.

التصنيف: مفهوم جوهري | المستوى: متوسط

إذا كان لديك إطار بيانات `df` يحتوي على عمود 'الفريق' وعمود 'الأهداف'، وأردت معرفة مجموع الأهداف لكل فريق، فما الكود الصحيح في pandas؟

  • أ) df.sum().groupby('الفريق')
  • ب) df.groupby('الفريق').sum('الأهداف')
  • ج) df.groupby('الفريق')['الأهداف'].sum()
  • د) df['الأهداف'].groupby(sum)

الإجابة الصحيحة: c

الإجابة: df.groupby('الفريق')['الأهداف'].sum()

الشرح: 1. `df.groupby('الفريق')`: تقسم البيانات إلى مجموعات، كل مجموعة تمثل فريقاً. 2. `['الأهداف']`: تختار العمود المراد تطبيق الدالة التجميعية عليه (الأهداف). 3. `.sum()`: تطبق دالة المجموع على قيم عمود 'الأهداف' داخل كل مجموعة (فريق).

تلميح: تذكر ترتيب الخطوات: التجميع أولاً، ثم اختيار العمود المراد تلخيصه، ثم الدالة التجميعية.

التصنيف: صيغة/خطوات | المستوى: صعب

أي من الدوال التالية تعتبر من دوال التجميع (Aggregate Functions) الشائعة؟

  • أ) sort, merge, drop, rename, fillna
  • ب) sum, count, min, max, mean
  • ج) print, input, len, type, range
  • د) head, tail, info, describe, shape

الإجابة الصحيحة: b

الإجابة: sum, count, min, max, mean

الشرح: الدوال التجميعية الشائعة هي: 1. sum: لجمع القيم. 2. count: لعد العناصر. 3. min: لإيجاد القيمة الدنيا. 4. max: لإيجاد القيمة القصوى. 5. mean: لحساب المتوسط الحسابي.

تلميح: جميعها تعمل على مجموعة من القيم وتُرجع قيمة واحدة تلخصها.

التصنيف: مفهوم جوهري | المستوى: سهل