📋 المحتوى المنظم
📖 محتوى تعليمي مفصّل
نوع: METADATA
تمرينات
1
نوع: QUESTION
حدد الجملة الصحيحة والجملة الخاطئة فيما يلي:
1. في التعلم الموجه تستخدم مجموعات البيانات المعنونة لتدريب النموذج.
2. البرمجة الاتجاهية هي تقنية لتحويل البيانات من تنسيق متجه رقمي إلى بيانات أولية.
3. تتطلب المصفوفة المتباعدة ذاكرة أقل بكثير من المصفوفة الكثيفة.
4. تُستخدم خوارزمية مصنف بايز الساذج لبناء خط أنابيب التنبؤ.
5. تكرار الكلمة في المستند يُعد التمثيل الدقيق الوحيد لأهمية هذه الكلمة.
2
نوع: QUESTION
اشرح لماذا تتطلب المصفوفة الكثيفة مساحة من الذاكرة أكبر من المصفوفة المتباعدة.
3
نوع: QUESTION
حلل كيف يُستخدم العاملان الرياضيان في تكرار المصطلح - تكرار المستند العكسي (TF-IDF) لتحديد أهمية الكلمة في النص.
نوع: METADATA
وزارة التعليم
Ministry of Education
2023 - 1447
نوع: METADATA
152
📝 أسئلة اختبارية
عدد الأسئلة: 8
سؤال 1: حدد الجملة الصحيحة والجملة الخاطئة فيما يلي:
الإجابة الصحيحة: انظر الأسئلة الفرعية
الشرح: هذا سؤال رئيسي يحتوي على أسئلة فرعية
تلميح: راجع الأسئلة الفرعية أدناه
سؤال 2: اشرح لماذا تتطلب المصفوفة الكثيفة مساحة من الذاكرة أكبر من المصفوفة المتباعدة.
- أ) لأن المصفوفة الكثيفة تحتوي على أعداد أكبر من العناصر.
- ب) لأن المصفوفة الكثيفة تخزن جميع القيم بما فيها الأصفار.
- ج) لأن المصفوفة المتباعدة تستخدم ضغط البيانات.
- د) لأن المصفوفة الكثيفة تتطلب معالجة أسرع.
الإجابة الصحيحة: المصفوفة الكثيفة تخزن جميع القيم بما فيها الأصفار، بينما المصفوفة المتباعدة تخزن فقط القيم غير الصفرية، مما يوفر مساحة ذاكرة.
الشرح: المصفوفة الكثيفة (dense matrix) تستخدم ذاكرة لكل عنصر في المصفوفة، حتى لو كان صفراً، بينما المصفوفة المتباعدة (sparse matrix) تستخدم هياكل بيانات فعالة لتخزين القيم غير الصفرية فقط، مما يقلل استخدام الذاكرة.
تلميح: قارن بين كيفية تخزين القيم في كل نوع من المصفوفات.
سؤال 3: حلل كيف يُستخدم العاملان الرياضيان في تكرار المصطلح - تكرار المستند العكسي (TF-IDF) لتحديد أهمية الكلمة في النص.
- أ) TF يقيس طول النص، وIDF يقيس عدد الكلمات الفريدة.
- ب) TF يقيس تكرار الكلمة في المستند، وIDF يقيس ندرة الكلمة عبر المستندات.
- ج) TF يقيس دقة الكلمة، وIDF يقيس سرعة المعالجة.
- د) TF يقيس أهمية الكلمة في اللغة، وIDF يقيس تكرارها في القاموس.
الإجابة الصحيحة: TF يقيس تكرار الكلمة في المستند، وIDF يقيس ندرة الكلمة عبر المستندات، ويتم دمجهما في TF-IDF لإعطاء وزن يعكس الأهمية.
الشرح: TF (Term Frequency) يحسب تكرار الكلمة في مستند معين، مما يعطي أهمية محلية. IDF (Inverse Document Frequency) يحسب عكس تكرار الكلمة عبر جميع المستندات، مما يعطي أهمية عالمية بمعاقبة الكلمات الشائعة. حاصل ضربهما (TF-IDF) يعطي وزنًا مركبًا يحدد أهمية الكلمة بدقة.
تلميح: فكر في دور كل من TF وIDF في تقييم الكلمة.
سؤال 1: في التعلم الموجه تستخدم مجموعات البيانات المعنونة لتدريب النموذج.
الإجابة الصحيحة: صحيح
الشرح: نعم، التعلم الموجه يعتمد على مجموعات بيانات معنونة (labeled data) لتدريب النماذج.
تلميح: ما هو التعلم الموجه؟
سؤال 1: البرمجة الاتجاهية هي تقنية لتحويل البيانات من تنسيق متجه رقمي إلى بيانات أولية.
الإجابة الصحيحة: خطأ
الشرح: البرمجة الاتجاهية (Vectorization) هي تقنية لتحويل البيانات الأولية إلى تنسيق متجه رقمي، وليس العكس.
تلميح: ما هو اتجاه تحويل البيانات في البرمجة الاتجاهية؟
سؤال 1: تتطلب المصفوفة المتباعدة ذاكرة أقل بكثير من المصفوفة الكثيفة.
الإجابة الصحيحة: صحيح
الشرح: نعم، المصفوفة المتباعدة (sparse matrix) تخزن فقط القيم غير الصفرية، مما يوفر ذاكرة مقارنة بالمصفوفة الكثيفة التي تخزن جميع القيم.
تلميح: كيف تخزن المصفوفة المتباعدة البيانات؟
سؤال 1: تُستخدم خوارزمية مصنف بايز الساذج لبناء خط أنابيب التنبؤ.
الإجابة الصحيحة: صحيح
الشرح: نعم، مصنف بايز الساذج (Naive Bayes) هو خوارزمية شائعة تستخدم في خطوط أنابيب التنبؤ، خاصة في معالجة النصوص.
تلميح: ما هي تطبيقات مصنف بايز الساذج؟
سؤال 1: تكرار الكلمة في المستند يُعد التمثيل الدقيق الوحيد لأهمية هذه الكلمة.
الإجابة الصحيحة: خطأ
الشرح: تكرار الكلمة (Term Frequency) ليس التمثيل الوحيد؛ هناك طرق أخرى مثل TF-IDF التي تأخذ في الاعتبار تكرار المستند العكسي.
تلميح: هل هناك مقاييس أخرى لأهمية الكلمة؟
🎴 بطاقات تعليمية للمراجعة
عدد البطاقات: 5 بطاقة لهذه الصفحة
في أي نوع من أنواع التعلم الآلي تُستخدم مجموعات البيانات المعنونة لتدريب النموذج؟
الإجابة: في التعلم الموجه (Supervised Learning) تُستخدم مجموعات البيانات المعنونة لتدريب النموذج.
الشرح: التعلم الموجه هو أحد أنواع التعلم الآلي حيث يتم تدريب النموذج باستخدام بيانات تتضمن المدخلات والمخرجات المرغوبة (الملصقات أو العناوين)، مما يسمح للنموذج بتعلم كيفية التنبؤ بالمخرجات للبيانات الجديدة.
تلميح: فكر في نوع التعلم الذي يعتمد على وجود 'إجابات صحيحة' مسبقاً في البيانات.
ما هي تقنية تحويل البيانات من تنسيق متجه رقمي إلى بيانات أولية؟
الإجابة: البرمجة الاتجاهية (Vectorization) هي تقنية لتحويل البيانات، مثل النصوص، من شكلها الأصلي (بيانات أولية) إلى تمثيل رقمي في صورة متجهات.
الشرح: تُعد البرمجة الاتجاهية خطوة أساسية في معالجة اللغات الطبيعية ومعظم تطبيقات الذكاء الاصطناعي، حيث تسمح للنماذج الحاسوبية بفهم ومعالجة البيانات غير الرقمية مثل النصوص.
تلميح: ابحث عن المصطلح الذي يشير إلى عملية تمثيل الكلمات أو النصوص كأرقام في فضاء متعدد الأبعاد.
لماذا تتطلب المصفوفة المتباعدة (Sparse Matrix) ذاكرة أقل بكثير من المصفوفة الكثيفة (Dense Matrix)؟
الإجابة: تتطلب المصفوفة المتباعدة ذاكرة أقل لأنها تخزن فقط القيم غير الصفرية وعناوينها، بينما تخزن المصفوفة الكثيفة جميع العناصر، بما في ذلك الأصفار.
الشرح: في المصفوفات المتباعدة، حيث تكون معظم القيم أصفاراً، فإن تخزين كل صفر بشكل صريح يكون هدراً كبيراً للذاكرة. لذلك، يتم اللجوء إلى تقنيات تخزين خاصة لا تسجل سوى القيم غير الصفرية ومواقعها.
تلميح: فكر في كيفية تخزين البيانات التي تحتوي على نسبة عالية من القيم المتشابهة (مثل الصفر).
ما هي الخوارزمية التي تُستخدم غالباً لبناء خط أنابيب التنبؤ (Prediction Pipeline) في بعض تطبيقات الذكاء الاصطناعي؟
الإجابة: خوارزمية مصنف بايز الساذج (Naive Bayes Classifier) تُستخدم أحياناً في بناء خطوط أنابيب التنبؤ، خاصة في مهام تصنيف النصوص.
الشرح: مصنف بايز الساذج هو خوارزمية تصنيف سريعة وفعالة، وتُعتبر أساسية في العديد من خطوط أنابيب التعلم الآلي، خاصة عندما تكون سرعة الأداء ووضوح النموذج من الأولويات.
تلميح: ابحث عن خوارزمية تصنيف بسيطة تعتمد على نظرية الاحتمالات.
هل تكرار الكلمة في المستند هو التمثيل الوحيد والدقيق لأهمية هذه الكلمة؟ وضح ذلك.
الإجابة: لا، تكرار الكلمة في المستند (Term Frequency - TF) ليس التمثيل الوحيد والدقيق لأهمية الكلمة. الأهمية الحقيقية تعتمد أيضاً على مدى ندرة الكلمة في المستندات الأخرى (Inverse Document Frequency - IDF).
الشرح: تكرار الكلمة (TF) يشير إلى مدى تكرار كلمة معينة في مستند واحد، لكن هذا التكرار قد يكون مضللاً إذا كانت الكلمة شائعة في اللغة بشكل عام. لذا، يتم استخدام مؤشر IDF (تكرار المستند العكسي) لتقليل وزن الكلمات الشائعة جداً وزيادة وزن الكلمات النادرة والمميزة للمستند.
تلميح: فكر في الكلمات الشائعة جداً في اللغة، مثل 'و' و 'في'. هل تكرارها يعني بالضرورة أهمية سياقية كبيرة؟