صفحة 127 - كتاب علم البيانات - الصف 11 - الفصل 1 - المملكة العربية السعودية

الكتاب: كتاب علم البيانات - الصف 11 - الفصل 1 | المادة: علم البيانات | المرحلة: الصف 11 | الفصل الدراسي: 1

الدولة: المملكة العربية السعودية | المنهج: المنهج السعودي - وزارة التعليم

📚 معلومات الصفحة

الكتاب: كتاب علم البيانات - الصف 11 - الفصل 1 | المادة: علم البيانات | المرحلة: الصف 11 | الفصل الدراسي: 1

الدولة: المملكة العربية السعودية | المنهج: المنهج السعودي - وزارة التعليم

نوع المحتوى: درس تعليمي

📝 ملخص الصفحة

📚 تمرينات مراجعة مفاهيم علم البيانات

المفاهيم الأساسية

* تمرينات: أسئلة تطبيقية لمراجعة المفاهيم الأساسية في علم البيانات.

خريطة المفاهيم

```markmap

تمرينات مراجعة مفاهيم علم البيانات

المقارنة بين هياكل البيانات

كائن المتسلسلة (Series)

إطار البيانات (DataFrame)

عمليات معالجة البيانات

فهرسة البيانات (Indexing)

تصفية البيانات (Filtering)

خطوات تحليل البيانات

تنظيف البيانات

#### أهمية تنظيف البيانات قبل التحليل

```

نقاط مهمة

  • تركز هذه التمرينات على ثلاثة مواضيع رئيسية: هياكل البيانات، عمليات المعالجة، وخطوات التحليل.
  • تهدف الأسئلة إلى اختبار فهم الطالب للفروق الأساسية بين المفاهيم العملية في علم البيانات.
  • التأكيد على أهمية خطوة تنظيف البيانات كمرحلة حاسمة قبل أي تحليل.

📄 النص الكامل للصفحة

تمرينات قارن بين كائن المتسلسلة وإطار البيانات. صف الفرق بين فهرسة البيانات وتصفيتها. اشرح أهمية تنظيف البيانات قبل البدء بتحليلها. وزارة التعليم Mistry of Education 2025-1447

✅ حلول أسئلة الكتاب الرسمية

عدد الأسئلة: 3

سؤال 1: قارن بين كائن المتسلسلة وإطار البيانات.

الإجابة: س1: المتسلسلة: بيانات أحادية البعد. إطار البيانات: جدول ثنائي البعد. العلاقة: كل عمود في الإطار هو متسلسلة.

خطوات الحل:

  1. **الشرح:** لنفهم هذا السؤال، نحتاج أولاً إلى معرفة ما هو كائن المتسلسلة (Series) وما هو إطار البيانات (DataFrame) في سياق تحليل البيانات. المتسلسلة هي هيكل بيانات بسيط، يمكننا تخيلها كعمود واحد من البيانات، مثل قائمة الأسماء أو قائمة الدرجات. لذلك، نقول إنها أحادية البعد. أما إطار البيانات فهو هيكل أكثر تعقيداً، يمكننا تخيله كجدول كامل يحتوي على عدة أعمدة وصفوف، مثل جدول يحتوي على أسماء الطلاب ودرجاتهم في مواد مختلفة. لذلك، نقول إنه ثنائي الأبعاد. العلاقة بينهما هي أن كل عمود داخل هذا الجدول (إطار البيانات) هو في الأساس متسلسلة منفصلة. فمثلاً، عمود "الأسماء" هو متسلسلة، وعمود "الدرجات" هو متسلسلة أخرى، ودمج هذه المتسلسلات معاً يشكل إطار البيانات. إذن الإجابة هي: **المتسلسلة: بيانات أحادية البعد. إطار البيانات: جدول ثنائي البعد. العلاقة: كل عمود في الإطار هو متسلسلة.**

سؤال 2: صف الفرق بين فهرسة البيانات وتصفيتها.

الإجابة: س2: الفهرسة: تحديد بيانات بالموقع أو الاسم. التصفية: اختيار بيانات تحقق شرطاً معيناً.

خطوات الحل:

  1. **الشرح:** الفكرة هنا هي التمييز بين عمليتين أساسيتين نستخدمهما للتعامل مع البيانات. لنبدأ بفهرسة البيانات (Indexing). الفهرسة تعني تحديد أو الوصول إلى بيانات معينة بناءً على موقعها أو اسمها. تخيل أن لديك قائمة درجات، فالفهرسة هي أن تقول: "أعطني الدرجة الموجودة في الصف الثالث" أو "أعطني عمود 'الرياضيات'"، أي أنك تحدد البيانات بموقعها أو عنوانها. أما تصفية البيانات (Filtering) فهي عملية مختلفة. هنا، لا نهتم بالموقع، بل نهتم بشرط معين. نقوم باختيار البيانات التي تحقق هذا الشرط فقط. مثلاً، من قائمة الدرجات، نريد فقط الدرجات التي تساوي 90 أو أكثر. هنا نطبق شرطاً (الدرجة >= 90) ونختار البيانات التي تحققه. باختصار، الفهرسة هي تحديد البيانات، والتَّصفية هي اختيار البيانات بناءً على شرط. إذن الإجابة هي: **الفهرسة: تحديد بيانات بالموقع أو الاسم. التصفية: اختيار بيانات تحقق شرطاً معيناً.**

سؤال 3: اشرح أهمية تنظيف البيانات قبل البدء بتحليلها.

الإجابة: س3: لضمان صحة النتائج عبر: - معالجة القيم المفقودة والأخطاء. - توحيد الصيغ والأنواع.

خطوات الحل:

  1. **الخطوة 1 (المفهوم):** قبل أن نبدأ بتحليل أي بيانات، سواء كانت درجات طلاب أو مبيعات متجر، يجب أن نتأكد من أن هذه البيانات نظيفة وصحيحة. تنظيف البيانات هو عملية تحضير البيانات وجعلها جاهزة للتحليل.
  2. **الخطوة 2 (التطبيق والأهمية):** لنتخيل أننا نحلل درجات طلاب. إذا كانت البيانات غير نظيفة، فقد نجد: - قيماً مفقودة: مثل درجات بعض الطلاب غير مسجلة. - أخطاء: مثل درجات مكتوبة كنص ('تسعون') بدلاً من رقم (90)، أو أسماء مواد مكتوبة بأشكال مختلفة ('رياضيات' و 'الرياضيات'). إذا حللنا البيانات بهذه المشاكل، ستكون نتائجنا وتحليلاتنا خاطئة أو مضللة. مثلاً، متوسط الدرجات سيكون غير دقيق إذا تجاهلنا القيم المفقودة، أو لن نستطيع تجميع البيانات إذا كانت أسماء المواد غير موحدة. لذلك، تنظيف البيانات يشمل معالجة هذه المشاكل: تعبئة القيم المفقودة بطريقة مناسبة، وتصحيح الأخطاء، وتوحيد كتابة البيانات (مثل جعل كل أسماء المواد بنفس الصيغة).
  3. **الخطوة 3 (النتيجة):** إذن، أهمية تنظيف البيانات قبل التحليل هي: **لضمان صحة ودقة النتائج والتحليلات، وذلك من خلال معالجة القيم المفقودة والأخطاء، وتوحيد صيغ وكتابة البيانات.**

🎴 بطاقات تعليمية للمراجعة

عدد البطاقات: 3 بطاقة لهذه الصفحة

ما الفرق الأساسي بين كائن المتسلسلة (Series) وإطار البيانات (DataFrame) في علم البيانات؟

  • أ) المتسلسلة تستخدم للنصوص فقط، بينما إطار البيانات للأرقام فقط.
  • ب) المتسلسلة هيكل بيانات أحادي البعد، بينما إطار البيانات هيكل بيانات ثنائي الأبعاد (جدول).
  • ج) المتسلسلة أسرع في المعالجة، بينما إطار البيانات أبطأ.
  • د) المتسلسلة تحتوي على صفوف فقط، بينما إطار البيانات يحتوي على أعمدة فقط.

الإجابة الصحيحة: b

الإجابة: المتسلسلة هيكل بيانات أحادي البعد، بينما إطار البيانات هيكل بيانات ثنائي الأبعاد (جدول).

الشرح: ١. كائن المتسلسلة (Series): يمثل عموداً واحداً من البيانات، مثل قائمة الأسماء أو الدرجات. فهو هيكل أحادي البعد. ٢. إطار البيانات (DataFrame): يمثل جدولاً كاملاً يحتوي على عدة أعمدة وصفوف. فهو هيكل ثنائي الأبعاد. ٣. العلاقة: كل عمود داخل إطار البيانات هو في الأساس متسلسلة منفصلة.

تلميح: فكر في عدد الأبعاد التي يمكن تخزين البيانات فيها في كل هيكل.

التصنيف: فرق بين مفهومين | المستوى: سهل

أي مما يلي يصف الفرق الصحيح بين فهرسة البيانات (Indexing) وتصفيتها (Filtering)؟

  • أ) الفهرسة: اختيار عينات عشوائية. التصفية: ترتيب البيانات تصاعدياً.
  • ب) الفهرسة: حذف البيانات المكررة. التصفية: استبدال القيم المفقودة.
  • ج) الفهرسة: تحديد بيانات بالموقع أو الاسم. التصفية: اختيار بيانات تحقق شرطاً معيناً.
  • د) الفهرسة: دمج مجموعتي بيانات. التصفية: تقسيم مجموعة البيانات إلى أجزاء.

الإجابة الصحيحة: c

الإجابة: الفهرسة: تحديد بيانات بالموقع أو الاسم. التصفية: اختيار بيانات تحقق شرطاً معيناً.

الشرح: ١. فهرسة البيانات (Indexing): هي عملية تحديد أو الوصول إلى بيانات معينة بناءً على موقعها (مثل الصف الثالث) أو اسمها (مثل اسم العمود). ٢. تصفية البيانات (Filtering): هي عملية اختيار مجموعة فرعية من البيانات بناءً على شرط معين (مثل: الدرجة > 90). ٣. الفرق: الفهرسة تستخدم الموقع/العنوان، بينما التصفية تستخدم الشرط المنطقي.

تلميح: الفهرسة مرتبطة بالموقع أو العنوان، بينما التصفية مرتبطة بشرط منطقي.

التصنيف: فرق بين مفهومين | المستوى: سهل

ما الفرق الرئيس بين كائن المتسلسلة (Series) وإطار البيانات (DataFrame) في سياق هياكل البيانات الأساسية؟

  • أ) المتسلسلة هيكل ثنائي الأبعاد، بينما إطار البيانات هيكل أحادي البعد يتكون من صفوف مترابطة.
  • ب) المتسلسلة هيكل أحادي البعد، بينما إطار البيانات هيكل ثنائي الأبعاد يمثل جدولاً أعمدته متسلسلات.
  • ج) كلاهما هياكل أحادية البعد، ولكن إطار البيانات يستخدم للنصوص فقط والمتسلسلة تستخدم للأرقام.
  • د) المتسلسلة تستخدم لتخزين الجداول الضخمة، بينما إطار البيانات يستخدم لتخزين قيمة مفردة فقط.

الإجابة الصحيحة: b

الإجابة: المتسلسلة هيكل أحادي البعد، بينما إطار البيانات هيكل ثنائي الأبعاد يمثل جدولاً أعمدته متسلسلات.

الشرح: 1. المتسلسلة (Series): هي هيكل بيانات بسيط أحادي البعد (1D)، تشبه العمود الواحد في الجدول. 2. إطار البيانات (DataFrame): هو هيكل بيانات ثنائي الأبعاد (2D)، يشبه الجدول المتكامل الذي يحتوي على صفوف وأعمدة. 3. العلاقة: يعتبر إطار البيانات وعاءً لمجموعة من المتسلسلات، حيث يمثل كل عمود فيه متسلسلة مستقلة.

تلميح: فكر في الفرق بين العمود الواحد والجدول المكون من عدة أعمدة وصفوف من حيث الأبعاد.

التصنيف: فرق بين مفهومين | المستوى: متوسط